Étiquetage multilingue en parties du discours avec MElt (Multilingual part-of-speech tagging with MElt)

Benoît Sagot


Abstract
Nous présentons des travaux récents réalisés autour de MElt, système discriminant d’étiquetage en parties du discours. MElt met l’accent sur l’exploitation optimale d’informations lexicales externes pour améliorer les performances des étiqueteurs par rapport aux modèles entraînés seulement sur des corpus annotés. Nous avons entraîné MElt sur plus d’une quarantaine de jeux de données couvrant plus d’une trentaine de langues. Comparé au système état-de-l’art MarMoT, MElt obtient en moyenne des résultats légèrement moins bons en l’absence de lexique externe, mais meilleurs lorsque de telles ressources sont disponibles, produisant ainsi des étiqueteurs état-de-l’art pour plusieurs langues.
Anthology ID:
2016.jeptalnrecital-poster.16
Volume:
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)
Month:
7
Year:
2016
Address:
Paris, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
AFCP - ATALA
Note:
Pages:
435–442
Language:
French
URL:
https://aclanthology.org/2016.jeptalnrecital-poster.16
DOI:
Bibkey:
Cite (ACL):
Benoît Sagot. 2016. Étiquetage multilingue en parties du discours avec MElt (Multilingual part-of-speech tagging with MElt). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters), pages 435–442, Paris, France. AFCP - ATALA.
Cite (Informal):
Étiquetage multilingue en parties du discours avec MElt (Multilingual part-of-speech tagging with MElt) (Sagot, JEP/TALN/RECITAL 2016)
Copy Citation:
PDF:
https://preview.aclanthology.org/update-css-js/2016.jeptalnrecital-poster.16.pdf