Abstract
Ce travail montre que la dégradation des performances souvent observée lors de l’application d’un analyseur morpho-syntaxique à des données hors domaine résulte souvent d’incohérences entre les annotations des ensembles de test et d’apprentissage. Nous montrons comment le principe de variation des annotations, introduit par Dickinson & Meurers (2003) pour identifier automatiquement les erreurs d’annotation, peut être utilisé pour identifier ces incohérences et évaluer leur impact sur les performances des analyseurs morpho-syntaxiques.- Anthology ID:
- 2018.jeptalnrecital-court.41
- Volume:
- Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
- Month:
- 5
- Year:
- 2018
- Address:
- Rennes, France
- Editors:
- Pascale Sébillot, Vincent Claveau
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 567–576
- Language:
- French
- URL:
- https://aclanthology.org/2018.jeptalnrecital-court.41
- DOI:
- Cite (ACL):
- Guillaume Wisniewski and François Yvon. 2018. Divergences entre annotations dans le projet Universal Dependencies et leur impact sur l’évaluation des performance d’étiquetage morpho-syntaxique (Evaluating Annotation Divergences in the UD Project). In Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN, pages 567–576, Rennes, France. ATALA.
- Cite (Informal):
- Divergences entre annotations dans le projet Universal Dependencies et leur impact sur l’évaluation des performance d’étiquetage morpho-syntaxique (Evaluating Annotation Divergences in the UD Project) (Wisniewski & Yvon, JEP/TALN/RECITAL 2018)
- PDF:
- https://preview.aclanthology.org/ingest-bitext-workshop/2018.jeptalnrecital-court.41.pdf