Classification automatique de données déséquilibrées et bruitées : application aux exercices de manuels scolaires
Elise Lincker, Camille Guinaudeau, Olivier Pons, Jérôme Dupire, Isabelle Barbet, Céline Hudelot, Vincent Mousseau, Caroline Huron
Abstract
Pour faciliter l’inclusion scolaire, il est indispensable de pouvoir adapter de manière automatique les manuels scolaires afin de les rendre accessibles aux enfants dyspraxiques. Dans ce contexte, nous proposons une tâche de classification des exercices selon leur type d’adaptation à la dyspraxie. Nous introduisons un corpus d’exercices extraits de manuels de français de niveau élémentaire, qui soulève certains défis de par sa petite taille et son contenu déséquilibré et bruité. Afin de tirer profit des modalités textuelles, structurelles et visuelles présentes dans nos données, nous combinons des modèles état de l’art par des stratégies de fusion précoce et tardive. Notre approche atteint une exactitude globale de 0.802. Toutefois, les expériences témoignent de la difficulté de la tâche, particulièrement pour les classes minoritaires, pour lesquelles l’exactitude tombe à 0.583.- Anthology ID:
- 2023.jeptalnrecital-international.14
- Volume:
- Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale
- Month:
- 6
- Year:
- 2023
- Address:
- Paris, France
- Editors:
- Christophe Servan, Anne Vilnat
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 121–130
- Language:
- French
- URL:
- https://aclanthology.org/2023.jeptalnrecital-international.14
- DOI:
- Cite (ACL):
- Elise Lincker, Camille Guinaudeau, Olivier Pons, Jérôme Dupire, Isabelle Barbet, Céline Hudelot, Vincent Mousseau, and Caroline Huron. 2023. Classification automatique de données déséquilibrées et bruitées : application aux exercices de manuels scolaires. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale, pages 121–130, Paris, France. ATALA.
- Cite (Informal):
- Classification automatique de données déséquilibrées et bruitées : application aux exercices de manuels scolaires (Lincker et al., JEP/TALN/RECITAL 2023)
- PDF:
- https://preview.aclanthology.org/nschneid-patch-4/2023.jeptalnrecital-international.14.pdf