Exploitation de Wikipédia pour l’Enrichissement et la Construction des Ressources Linguistiques

Fatiha Sadat, Alexandre Terrasa


Abstract
Cet article présente une approche et des résultats utilisant l’encyclopédie en ligne Wikipédia comme ressource semi-structurée de connaissances linguistiques et en particulier comme un corpus comparable pour l’extraction de terminologie bilingue. Cette approche tend à extraire d’abord des paires de terme et traduction à partir de types des informations, liens et textes de Wikipédia. L’étape suivante consiste à l’utilisation de l’information linguistique afin de ré-ordonner les termes et leurs traductions pertinentes et ainsi éliminer les termes cibles inutiles. Les évaluations préliminaires utilisant les paires de langues français-anglais, japonais-français et japonais-anglais ont montré une bonne qualité des paires de termes extraits. Cette étude est très favorable pour la construction et l’enrichissement des ressources linguistiques tels que les dictionnaires et ontologies multilingues. Aussi, elle est très utile pour un système de recherche d’information translinguistique (RIT).
Anthology ID:
2010.jeptalnrecital-demonstration.6
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
24–27
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-demonstration.6
DOI:
Bibkey:
Cite (ACL):
Fatiha Sadat and Alexandre Terrasa. 2010. Exploitation de Wikipédia pour l’Enrichissement et la Construction des Ressources Linguistiques. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Démonstrations, pages 24–27, Montréal, Canada. ATALA.
Cite (Informal):
Exploitation de Wikipédia pour l’Enrichissement et la Construction des Ressources Linguistiques (Sadat & Terrasa, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2010.jeptalnrecital-demonstration.6.pdf