Abstract
Pour la désambiguïsation lexicale en anglais, on compte aujourd’hui une quinzaine de corpus annotés en sens dans des formats souvent différents et provenant de différentes versions du Princeton WordNet. Nous présentons un format pour uniformiser ces corpus, et nous fournissons à la communauté l’ensemble des corpus annotés en anglais portés à notre connaissance avec des sens uniformisés du Princeton WordNet 3.0, lorsque les droits le permettent et le code source pour construire l’ensemble des corpus à partir des données originales.- Anthology ID:
- 2017.jeptalnrecital-demo.9
- Volume:
- Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations
- Month:
- 6
- Year:
- 2017
- Address:
- Orléans, France
- Editors:
- Iris Eshkol-Taravella, Jean-Yves Antoine
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 27–29
- Language:
- French
- URL:
- https://preview.aclanthology.org/build-pipeline-with-new-library/2017.jeptalnrecital-demo.9/
- DOI:
- Cite (ACL):
- Loïc Vial, Benjamin Lecouteux, and Didier Schwab. 2017. Uniformisation de corpus anglais annotés en sens (Unification of sense annotated English corpora for word sense disambiguation). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations, pages 27–29, Orléans, France. ATALA.
- Cite (Informal):
- Uniformisation de corpus anglais annotés en sens (Unification of sense annotated English corpora for word sense disambiguation) (Vial et al., JEP/TALN/RECITAL 2017)
- PDF:
- https://preview.aclanthology.org/build-pipeline-with-new-library/2017.jeptalnrecital-demo.9.pdf