Quelques observations sur la notion de biais dans les modèles de langue

Romane Gallienne, Thierry Poibeau


Abstract
Cet article revient sur la notion de biais dans les modèles de langue. On montre à partir d’exemples tirés de modèles génératifs pour le français (de type GPT) qu’il est facile d’orienter, à partir de prompts précis, les textes générés vers des résultats potentiellement problématiques (avec des stéréotypes, des biais, etc.). Mais les actions à accomplir à partir de là ne sont pas neutres : le fait de débiaiser les modèles a un aspect positif mais pose aussi de nombreuses questions (comment décider ce qu’il faut corriger ? qui peut ou doit le décider ? par rapport à quelle norme?). Finalement, on montre que les questions posées ne sont pas seulement technologiques, mais avant tout sociales, et liées au contexte d’utilisation des applications visées.
Anthology ID:
2023.jeptalnrecital-statement.1
Volume:
Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 3 : prises de position en TAL
Month:
6
Year:
2023
Address:
Paris, France
Editors:
Christophe Servan, Anne Vilnat
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
1–13
Language:
French
URL:
https://aclanthology.org/2023.jeptalnrecital-statement.1
DOI:
Bibkey:
Cite (ACL):
Romane Gallienne and Thierry Poibeau. 2023. Quelques observations sur la notion de biais dans les modèles de langue. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 3 : prises de position en TAL, pages 1–13, Paris, France. ATALA.
Cite (Informal):
Quelques observations sur la notion de biais dans les modèles de langue (Gallienne & Poibeau, JEP/TALN/RECITAL 2023)
Copy Citation:
PDF:
https://preview.aclanthology.org/nschneid-patch-4/2023.jeptalnrecital-statement.1.pdf