Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français
Thi-Ngoc-Diep Do, Viet-Bac Le, Brigitte Bigi, Laurent Besacier, Eric Castelli
Abstract
Cet article présente nos premiers travaux en vue de la construction d’un système de traduction probabiliste pour le couple de langue vietnamien-français. La langue vietnamienne étant considérée comme une langue peu dotée, une des difficultés réside dans la constitution des corpus parallèles, indispensable à l’apprentissage des modèles. Nous nous concentrons sur la constitution d’un grand corpus parallèle vietnamien-français. La méthode d’identification automatique des paires de documents parallèles fondée sur la date de publication, les mots spéciaux et les scores d’alignements des phrases est appliquée. Cet article présente également la construction d’un premier système de traduction automatique probabiliste vietnamienfrançais et français-vietnamien à partir de ce corpus et discute l’opportunité d’utiliser des unités lexicales ou sous-lexicales pour le vietnamien (syllabes, mots, ou leurs combinaisons). Les performances du système sont encourageantes et se comparent avantageusement à celles du système de Google.- Anthology ID:
- 2009.jeptalnrecital-long.9
- Volume:
- Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2009
- Address:
- Senlis, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 81–90
- Language:
- French
- URL:
- https://aclanthology.org/2009.jeptalnrecital-long.9
- DOI:
- Cite (ACL):
- Thi-Ngoc-Diep Do, Viet-Bac Le, Brigitte Bigi, Laurent Besacier, and Eric Castelli. 2009. Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 81–90, Senlis, France. ATALA.
- Cite (Informal):
- Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français (Do et al., JEP/TALN/RECITAL 2009)
- PDF:
- https://preview.aclanthology.org/remove-xml-comments/2009.jeptalnrecital-long.9.pdf