@inproceedings{claveau-etal-2021-la,
    title = "La g{\'e}n{\'e}ration de textes artificiels en substitution ou en compl{\'e}ment de donn{\'e}es d{'}apprentissage (Generating artificial texts as substitution or complement of training data )",
    author = "Claveau, Vincent  and
      Chaffin, Antoine  and
      Kijak, Ewa",
    editor = "Denis, Pascal  and
      Grabar, Natalia  and
      Fraisse, Amel  and
      Cardon, R{\'e}mi  and
      Jacquemin, Bernard  and
      Kergosien, Eric  and
      Balvet, Antonio",
    booktitle = "Actes de la 28e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
    month = "6",
    year = "2021",
    address = "Lille, France",
    publisher = "ATALA",
    url = "https://preview.aclanthology.org/ingest-emnlp/2021.jeptalnrecital-taln.4/",
    pages = "37--49",
    language = "fra",
    abstract = "La qualit{\'e} des textes g{\'e}n{\'e}r{\'e}s artificiellement s{'}est consid{\'e}rablement am{\'e}lior{\'e}e avec l{'}apparition des transformers. La question d{'}utiliser ces mod{\`e}les pour augmenter les donn{\'e}es d{'}apprentissage pour des t{\^a}ches d{'}apprentissage supervis{\'e} se pose naturellement. Dans cet article, cette question est explor{\'e}e sous 3 aspects : (i) les donn{\'e}es artificielles sont-elles un compl{\'e}ment efficace ? (ii) peuvent-elles remplacer les donn{\'e}es d{'}origines quand ces derni{\`e}res ne peuvent pas {\^e}tre distribu{\'e}es, par exemple pour des raisons de confidentialit{\'e} ? (iii) peuvent-elles am{\'e}liorer l{'}explicabilit{\'e} des classifieurs ? Diff{\'e}rentes exp{\'e}riences sont men{\'e}es sur une t{\^a}che de classification en utilisant des donn{\'e}es g{\'e}n{\'e}r{\'e}es artificiellement en adaptant des mod{\`e}les GPT-2. Les r{\'e}sultats montrent que les donn{\'e}es artificielles ne sont pas encore suffisamment bonnes et n{\'e}cessitent un pr{\'e}-traitement pour am{\'e}liorer significativement les performances. Nous montrons que les approches sac-de-mots b{\'e}n{\'e}ficient le plus de telles augmentations de donn{\'e}es."
}Markdown (Informal)
[La génération de textes artificiels en substitution ou en complément de données d’apprentissage (Generating artificial texts as substitution or complement of training data )](https://preview.aclanthology.org/ingest-emnlp/2021.jeptalnrecital-taln.4/) (Claveau et al., JEP/TALN/RECITAL 2021)
ACL