Similarité sémantique et extraction de synonymes à partir de corpus

Olivier Ferret


Abstract
La définition de mesures sémantiques au niveau lexical a fait l’objet de nombreux travaux depuis plusieurs années. Dans cet article, nous nous focalisons plus spécifiquement sur les mesures de nature distributionnelle. Bien que différentes évaluations ont été réalisées les concernant, il reste difficile à établir si une mesure donnant de bons résultats dans un cadre d’évaluation peut être appliquée plus largement avec le même succès. Dans le travail présenté, nous commençons par sélectionner une mesure de similarité sur la base d’un test de type TOEFL étendu. Nous l’appliquons ensuite au problème de l’extraction de synonymes à partir de corpus en comparant nos résultats avec ceux de (Curran & Moens, 2002). Enfin, nous testons l’intérêt pour cette tâche d’extraction de synonymes d’une méthode d’amélioration de la qualité des données distributionnelles proposée dans (Zhitomirsky-Geffet & Dagan, 2009).
Anthology ID:
2010.jeptalnrecital-long.4
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
31–40
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.4
DOI:
Bibkey:
Cite (ACL):
Olivier Ferret. 2010. Similarité sémantique et extraction de synonymes à partir de corpus. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 31–40, Montréal, Canada. ATALA.
Cite (Informal):
Similarité sémantique et extraction de synonymes à partir de corpus (Ferret, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2010.jeptalnrecital-long.4.pdf