@inproceedings{liyanage-buscaldi-2023-la,
title = "La d{\'e}tection de textes g{\'e}n{\'e}r{\'e}s par des mod{\`e}les de langue : une t{\^a}che complexe? Une {\'e}tude sur des textes acad{\'e}miques",
author = "Liyanage, Vijini and
Buscaldi, Davide",
editor = {Boudin, Florian and
Daille, B{\'e}atrice and
Dufour, Richard and
El, Oumaima and
Houbre, Ma{\"e}l and
Jourdan, L{\'e}ane and
Kooli, Nihel},
booktitle = "Actes de CORIA-TALN 2023. Actes de l'atelier ``Analyse et Recherche de Textes Scientifiques'' (ARTS)@TALN 2023",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-arts.12/",
pages = "71--78",
language = "fra",
abstract = "L'{\'e}mergence de mod{\`e}les de langage tr{\`e}s puissants tels que GPT-3 a sensibilis{\'e} les chercheurs {\`a} la probl{\'e}matique de la d{\'e}tection de textes acad{\'e}miques g{\'e}n{\'e}r{\'e}s automatiquement, principalement dans un souci de pr{\'e}vention de plagiat. Plusieurs {\'e}tudes ont montr{\'e} que les mod{\`e}les de d{\'e}tection actuels ont une pr{\'e}cision {\'e}lev{\'e}e, en donnant l{'}impression que la t{\^a}che soit r{\'e}solue. Cependant, nous avons observ{\'e} que les ensembles de donn{\'e}es utilis{\'e}s pour ces exp{\'e}riences contiennent des textes g{\'e}n{\'e}r{\'e}s automatiquement {\`a} partir de mod{\`e}les pr{\'e}-entra{\^i}n{\'e}s. Une utilisation plus r{\'e}aliste des mod{\`e}les de langage consisterait {\`a} effectuer un fine-tuning sur un texte {\'e}crit par un humain pour compl{\'e}ter les parties manquantes. Ainsi, nous avons constitu{\'e} un corpus de textes g{\'e}n{\'e}r{\'e}s de mani{\`e}re plus r{\'e}aliste et men{\'e} des exp{\'e}riences avec plusieurs mod{\`e}les de classification. Nos r{\'e}sultats montrent que lorsque les ensembles de donn{\'e}es sont g{\'e}n{\'e}r{\'e}s de mani{\`e}re r{\'e}aliste pour simuler l{'}utilisation de mod{\`e}les de langage par les chercheurs, la d{\'e}tection de ces textes devient une t{\^a}che assez difficile."
}
Markdown (Informal)
[La détection de textes générés par des modèles de langue : une tâche complexe? Une étude sur des textes académiques](https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-arts.12/) (Liyanage & Buscaldi, JEP/TALN/RECITAL 2023)
ACL