Abstract
Dans cet article, nous présentons une méthode de transformation de Wikipédia en ressource d’information externe pour détecter et désambiguïser des entités nommées, en milieu ouvert et sans apprentissage spécifique. Nous expliquons comment nous construisons notre système, puis nous utilisons cinq éditions linguistiques de Wikipédia afin d’enrichir son lexique. Pour finir nous réalisons une évaluation et comparons les performances du système avec et sans compléments lexicaux issus des informations inter-linguistiques, sur une tâche d’extraction d’entités nommées appliquée à un corpus d’articles journalistiques.- Anthology ID:
- 2009.jeptalnrecital-recital.10
- Volume:
- Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
- Month:
- June
- Year:
- 2009
- Address:
- Senlis, France
- Editors:
- Thibault Mondary, Aurélien Bossard, Thierry Hamon
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 91–100
- Language:
- French
- URL:
- https://aclanthology.org/2009.jeptalnrecital-recital.10
- DOI:
- Cite (ACL):
- Eric Charton. 2009. Combinaison de contenus encyclopédiques multilingues pour une reconnaissance d’entités nommées en contexte. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 91–100, Senlis, France. ATALA.
- Cite (Informal):
- Combinaison de contenus encyclopédiques multilingues pour une reconnaissance d’entités nommées en contexte (Charton, JEP/TALN/RECITAL 2009)
- PDF:
- https://preview.aclanthology.org/naacl24-info/2009.jeptalnrecital-recital.10.pdf