Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling)

Adrien Lardilleux, François Yvon, Yves Lepage


Abstract
L’alignement sous-phrastique consiste à extraire des traductions d’unités textuelles de grain inférieur à la phrase à partir de textes multilingues parallèles alignés au niveau de la phrase. Un tel alignement est nécessaire, par exemple, pour entraîner des systèmes de traduction statistique. L’approche standard pour réaliser cette tâche implique l’estimation successive de plusieurs modèles probabilistes de complexité croissante et l’utilisation d’heuristiques qui permettent d’aligner des mots isolés, puis, par extension, des groupes de mots. Dans cet article, nous considérons une approche alternative, initialement proposée dans (Lardilleux & Lepage, 2008), qui repose sur un principe beaucoup plus simple, à savoir la comparaison des profils d’occurrences dans des souscorpus obtenus par échantillonnage. Après avoir analysé les forces et faiblesses de cette approche, nous montrons comment améliorer la détection d’unités de traduction longues, et évaluons ces améliorations sur des tâches de traduction automatique.
Anthology ID:
2011.jeptalnrecital-long.36
Volume:
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2011
Address:
Montpellier, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
412–423
Language:
French
URL:
https://aclanthology.org/2011.jeptalnrecital-long.36
DOI:
Bibkey:
Cite (ACL):
Adrien Lardilleux, François Yvon, and Yves Lepage. 2011. Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling). In Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 412–423, Montpellier, France. ATALA.
Cite (Informal):
Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling) (Lardilleux et al., JEP/TALN/RECITAL 2011)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2011.jeptalnrecital-long.36.pdf