Acquisition de relations lexicales désambiguïsées à partir du Web

Chrystel Millon


Abstract
Nous montrons dans cet article qu’un pré-étiquetage des usages des mots par un algorithme de désambiguïsation tel qu’HyperLex (Véronis, 2003, 2004) permet d’obtenir des relations lexicales (du type NOM-ADJECTIF, NOM de NOM, NOM-VERBE) beaucoup plus exploitables, parce qu’elles-mêmes catégorisées en fonction des usages. De plus, cette technique permet d’obtenir des relations pour des usages très peu fréquents, alors qu’une extraction indifférenciée « noie » ces relations au milieu de celles correspondant aux usages les plus fréquents. Nous avons conduit une évaluation sur un corpus de plusieurs milliers de pages Web comportant l’un des 10 mots-cibles très polysémiques choisis pour cette expérience, et nous montrons que la précision obtenue est très bonne, avec un rappel honorable, suffisant en tout cas pour de nombreuses applications. L’analyse des erreurs ouvre des perspectives d’améliorations pour la suite de notre travail de thèse.
Anthology ID:
2004.jeptalnrecital-recital.2
Volume:
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
April
Year:
2004
Address:
Fès, Maroc
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
11–20
Language:
French
URL:
https://aclanthology.org/2004.jeptalnrecital-recital.2
DOI:
Bibkey:
Cite (ACL):
Chrystel Millon. 2004. Acquisition de relations lexicales désambiguïsées à partir du Web. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 11–20, Fès, Maroc. ATALA.
Cite (Informal):
Acquisition de relations lexicales désambiguïsées à partir du Web (Millon, JEP/TALN/RECITAL 2004)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2004.jeptalnrecital-recital.2.pdf