@inproceedings{claveau-etal-2021-la,
title = "La g{\'e}n{\'e}ration de textes artificiels en substitution ou en compl{\'e}ment de donn{\'e}es d`apprentissage (Generating artificial texts as substitution or complement of training data )",
author = "Claveau, Vincent and
Chaffin, Antoine and
Kijak, Ewa",
editor = "Denis, Pascal and
Grabar, Natalia and
Fraisse, Amel and
Cardon, R{\'e}mi and
Jacquemin, Bernard and
Kergosien, Eric and
Balvet, Antonio",
booktitle = "Actes de la 28e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2021",
address = "Lille, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/add-emnlp-2024-awards/2021.jeptalnrecital-taln.4/",
pages = "37--49",
language = "fra",
abstract = "La qualit{\'e} des textes g{\'e}n{\'e}r{\'e}s artificiellement s`est consid{\'e}rablement am{\'e}lior{\'e}e avec l`apparition des transformers. La question d`utiliser ces mod{\`e}les pour augmenter les donn{\'e}es d`apprentissage pour des t{\^a}ches d`apprentissage supervis{\'e} se pose naturellement. Dans cet article, cette question est explor{\'e}e sous 3 aspects : (i) les donn{\'e}es artificielles sont-elles un compl{\'e}ment efficace ? (ii) peuvent-elles remplacer les donn{\'e}es d`origines quand ces derni{\`e}res ne peuvent pas {\^e}tre distribu{\'e}es, par exemple pour des raisons de confidentialit{\'e} ? (iii) peuvent-elles am{\'e}liorer l`explicabilit{\'e} des classifieurs ? Diff{\'e}rentes exp{\'e}riences sont men{\'e}es sur une t{\^a}che de classification en utilisant des donn{\'e}es g{\'e}n{\'e}r{\'e}es artificiellement en adaptant des mod{\`e}les GPT-2. Les r{\'e}sultats montrent que les donn{\'e}es artificielles ne sont pas encore suffisamment bonnes et n{\'e}cessitent un pr{\'e}-traitement pour am{\'e}liorer significativement les performances. Nous montrons que les approches sac-de-mots b{\'e}n{\'e}ficient le plus de telles augmentations de donn{\'e}es."
}
Markdown (Informal)
[La génération de textes artificiels en substitution ou en complément de données d’apprentissage (Generating artificial texts as substitution or complement of training data )](https://preview.aclanthology.org/add-emnlp-2024-awards/2021.jeptalnrecital-taln.4/) (Claveau et al., JEP/TALN/RECITAL 2021)
ACL