@inproceedings{kent-rachmat-2025-analyse,
title = "Analyse de la litt{\'e}rature sur les strat{\'e}gies d{'}augmentation de donn{\'e}es dans des contextes {\`a} faible ressources",
author = "Kent Rachmat, Benedictus",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 18e Rencontres Jeunes Chercheurs en RI (RJCRI) et 27{\`e}me Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-recital.2/",
pages = "14--30",
language = "fra",
abstract = "Les grands mod{\`e}les de langage (LLMs) ont r{\'e}volutionn{\'e} le traitement automatique des langues (TAL), mais leur succ{\`e}s demeure largement limit{\'e} aux domaines g{\'e}n{\'e}ralistes disposant de ressources abondantes. En revanche, l{'}application des LLMs {\`a} des domaines sp{\'e}cialis{\'e}s {\`a} faibles ressources soul{\`e}ve des d{\'e}fis majeurs li{\'e}s {\`a} la raret{\'e} des donn{\'e}es d{'}entra{\^i}nement, {\`a} la d{\'e}rive de domaine et aux contraintes terminologiques strictes. Cette revue propose un {\'e}tat de l{'}art des approches actuelles pour le question-r{\'e}ponse (QA) en contexte sp{\'e}cialis{\'e} et {\`a} faibles ressources avec les LLMs. Nous commen{\c{c}}ons par analyser la couverture et la repr{\'e}sentativit{\'e} des jeux de donn{\'e}es de QA sp{\'e}cialis{\'e}s en les comparant {\`a} de grands ensembles de r{\'e}f{\'e}rence, que nous appelons ParentQA . Sur la base de cette analyse, nous passons en revue les strat{\'e}gies centr{\'e}es sur les donn{\'e}es visant {\`a} accro{\^i}tre la diversit{\'e} des entr{\'e}es, notamment {\`a} travers des techniques d{'}augmentation. Nous abordons {\'e}galement les m{\'e}triques d'{\'e}valuation adapt{\'e}es aux t{\^a}ches sp{\'e}cialis{\'e}es et les consid{\'e}rations {\'e}thiques associ{\'e}es. En cartographiant les m{\'e}thodologies existantes et en identifiant les questions de recherche ouvertes, cette {\'e}tude vise {\`a} orienter les futurs travaux sur l{'}adaptation des LLMs pour une utilisation robuste et responsable dans des environnements contraints en ressources et sp{\'e}cifiques {\`a} un domaine."
}
Markdown (Informal)
[Analyse de la littérature sur les stratégies d’augmentation de données dans des contextes à faible ressources](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-recital.2/) (Kent Rachmat, JEP/TALN/RECITAL 2025)
ACL