Alignement de traductions rares à l’aide de paires de phrases non alignées

Julien Bourdaillet, Stéphane Huet, Philippe Langlais


Abstract
Bien souvent, le sens d’un mot ou d’une expression peut être rendu dans une autre langue par plusieurs traductions. Parmi celles-ci, certaines se révèlent très fréquentes alors que d’autres le sont beaucoup moins, conformément à une loi zipfienne. La googlisation de notre monde n’échappe pas aux mémoires de traduction, qui mettent souvent à mal ou simplement ignorent ces traductions rares qui sont souvent de bonne qualité. Dans cet article, nous nous intéressons à ces traductions rares sous l’angle du repérage de traductions. Nous argumentons qu’elles sont plus difficiles à identifier que les traductions plus fréquentes. Nous décrivons une approche originale qui permet de mieux les identifier en tirant profit de l’alignement au niveau des mots de paires de phrases qui ne sont pas alignées. Nous montrons que cette approche permet d’améliorer l’identification de ces traductions rares.
Anthology ID:
2010.jeptalnrecital-long.2
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
11–20
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.2
DOI:
Bibkey:
Cite (ACL):
Julien Bourdaillet, Stéphane Huet, and Philippe Langlais. 2010. Alignement de traductions rares à l’aide de paires de phrases non alignées. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 11–20, Montréal, Canada. ATALA.
Cite (Informal):
Alignement de traductions rares à l’aide de paires de phrases non alignées (Bourdaillet et al., JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2010.jeptalnrecital-long.2.pdf