Un système modulaire d’acquisition automatique de traductions à partir du Web

Stéphanie Léon


Abstract
Nous présentons une méthode de Traduction Automatique d’Unités Lexicales Complexes (ULC) pour la construction de ressources bilingues français/anglais, basée sur un système modulaire qui prend en compte les propriétés linguistiques des unités sources (compositionnalité, polysémie, etc.). Notre système exploite les différentes « facettes » du Web multilingue pour valider des traductions candidates ou acquérir de nouvelles traductions. Après avoir collecté une base d’ULC en français à partir d’un corpus de pages Web, nous passons par trois phases de traduction qui s’appliquent à un cas linguistique, avec une méthode adaptée : les traductions compositionnelles non polysémiques, les traductions compositionnelles polysémiques et les traductions non compositionnelles et/ou inconnues. Notre évaluation sur un vaste échantillon d’ULC montre que l’exploitation du Web pour la traduction et la prise en compte des propriétés linguistiques au sein d’un système modulaire permet une acquisition automatique de traductions avec une excellente précision.
Anthology ID:
2009.jeptalnrecital-long.27
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Adeline Nazarenko, Thierry Poibeau
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
261–270
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-long.27
DOI:
Bibkey:
Cite (ACL):
Stéphanie Léon. 2009. Un système modulaire d’acquisition automatique de traductions à partir du Web. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 261–270, Senlis, France. ATALA.
Cite (Informal):
Un système modulaire d’acquisition automatique de traductions à partir du Web (Léon, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2009.jeptalnrecital-long.27.pdf