Bruno Cavestro
2005
Translating with Non-contiguous Phrases
Michel Simard
|
Nicola Cancedda
|
Bruno Cavestro
|
Marc Dymetman
|
Eric Gaussier
|
Cyril Goutte
|
Kenji Yamada
|
Philippe Langlais
|
Arne Mauser
Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing
Une approche à la traduction automatique statistique par segments discontinus
Michel Simard
|
Nicola Cancedda
|
Bruno Cavestro
|
Marc Dymetman
|
Eric Gaussier
|
Cyril Goutte
|
Philippe Langlais
|
Arne Mauser
|
Kenji Yamada
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Cet article présente une méthode de traduction automatique statistique basée sur des segments non-continus, c’est-à-dire des segments formés de mots qui ne se présentent pas nécéssairement de façon contiguë dans le texte. On propose une méthode pour produire de tels segments à partir de corpus alignés au niveau des mots. On présente également un modèle de traduction statistique capable de tenir compte de tels segments, de même qu’une méthode d’apprentissage des paramètres du modèle visant à maximiser l’exactitude des traductions produites, telle que mesurée avec la métrique NIST. Les traductions optimales sont produites par le biais d’une recherche en faisceau. On présente finalement des résultats expérimentaux, qui démontrent comment la méthode proposée permet une meilleure généralisation à partir des données d’entraînement.
Search
Co-authors
- Michel Simard 2
- Nicola Cancedda 2
- Marc Dymetman 2
- Eric Gaussier 2
- Cyril Goutte 2
- show all...