Abstract
Les principaux travaux en extraction de lexiques bilingues à partir de corpus comparables reposent sur l’hypothèse implicite que ces corpus sont équilibrés. Cependant, les différentes méthodes computationnelles associées sont relativement insensibles à la taille de chaque partie du corpus. Dans ce contexte, nous étudions l’influence que peut avoir un corpus comparable déséquilibré sur la qualité des terminologies bilingues extraites à travers différentes expériences. Nos résultats montrent que sous certaines conditions l’utilisation d’un corpus comparable déséquilibré peut engendrer un gain significatif dans la qualité des lexiques extraits.- Anthology ID:
- 2009.jeptalnrecital-long.6
- Volume:
- Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2009
- Address:
- Senlis, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 51–60
- Language:
- French
- URL:
- https://aclanthology.org/2009.jeptalnrecital-long.6
- DOI:
- Cite (ACL):
- Emmanuel Morin. 2009. Apport d’un corpus comparable déséquilibré à l’extraction de lexiques bilingues. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 51–60, Senlis, France. ATALA.
- Cite (Informal):
- Apport d’un corpus comparable déséquilibré à l’extraction de lexiques bilingues (Morin, JEP/TALN/RECITAL 2009)
- PDF:
- https://preview.aclanthology.org/remove-xml-comments/2009.jeptalnrecital-long.6.pdf