Modèles statistiques pour l’estimation automatique de la difficulté de textes de FLE

Thomas François


Abstract
La lecture constitue l’une des tâches essentielles dans l’apprentissage d’une langue étrangère. Toutefois, la découverte d’un texte portant sur un sujet précis et qui soit adapté au niveau de chaque apprenant est consommatrice de temps et pourrait être automatisée. Des expériences montrent que, pour l’anglais, l’utilisation de classifieurs statistiques permet d’estimer automatiquement la difficulté d’un texte. Dans cet article, nous proposons une méthodologie originale comparant, pour le français langue étrangère (FLE), diverses techniques de classification (la régression logistique, le bagging et le boosting) sur deux corpus d’entraînement. Il ressort de cette analyse comparative une légère supériorité de la régression logistique multinomiale.
Anthology ID:
2009.jeptalnrecital-recital.7
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Thibault Mondary, Aurélien Bossard, Thierry Hamon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
61–70
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-recital.7
DOI:
Bibkey:
Cite (ACL):
Thomas François. 2009. Modèles statistiques pour l’estimation automatique de la difficulté de textes de FLE. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 61–70, Senlis, France. ATALA.
Cite (Informal):
Modèles statistiques pour l’estimation automatique de la difficulté de textes de FLE (François, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2009.jeptalnrecital-recital.7.pdf