Construction d’un wordnet libre du français à partir de ressources multilingues

Benoît Sagot, Darja Fišer


Abstract
Cet article décrit la construction d’un Wordnet Libre du Français (WOLF) à partir du Princeton WordNet et de diverses ressources multilingues. Les lexèmes polysémiques ont été traités au moyen d’une approche reposant sur l’alignement en mots d’un corpus parallèle en cinq langues. Le lexique multilingue extrait a été désambiguïsé sémantiquement à l’aide des wordnets des langues concernées. Par ailleurs, une approche bilingue a été suffisante pour construire de nouvelles entrées à partir des lexèmes monosémiques. Nous avons pour cela extrait des lexiques bilingues à partir deWikipédia et de thésaurus. Le wordnet obtenu a été évalué par rapport au wordnet français issu du projet EuroWordNet. Les résultats sont encourageants, et des applications sont d’ores et déjà envisagées.
Anthology ID:
2008.jeptalnrecital-long.18
Volume:
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2008
Address:
Avignon, France
Editors:
Frédéric Béchet, Jean-Francois Bonastre
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
171–180
Language:
French
URL:
https://aclanthology.org/2008.jeptalnrecital-long.18
DOI:
Bibkey:
Cite (ACL):
Benoît Sagot and Darja Fišer. 2008. Construction d’un wordnet libre du français à partir de ressources multilingues. In Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 171–180, Avignon, France. ATALA.
Cite (Informal):
Construction d’un wordnet libre du français à partir de ressources multilingues (Sagot & Fišer, JEP/TALN/RECITAL 2008)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2008.jeptalnrecital-long.18.pdf