Translittération automatique pour une paire de langues peu dotée ()

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard


Abstract
La translittération convertit phonétiquement les mots dans une langue source (i.e. français) en mots équivalents dans une langue cible (i.e. vietnamien). Cette conversion nécessite un nombre considérable de règles définies par les experts linguistes pour déterminer comment les phonèmes sont alignés ainsi que prendre en compte le système de phonologie de la langue cible. La problématique pour les paires de langues peu dotées lie à la pénurie des ressources linguistiques. Dans ce travail de recherche, nous présentons une démonstration de conversion de graphème en phonème pour pallier au problème de translittération pour une paire de langues peu dotée, avec une application sur français-vietnamien. Notre système nécessite un petit corpus d’apprentissage phonétique bilingue. Nous avons obtenu des résultats prometteurs, avec un gain de +4,40% de score BLEU, par rapport au système de base utilisant l’approche de traduction automatique statistique.
Anthology ID:
2017.jeptalnrecital-demo.13
Volume:
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations
Month:
6
Year:
2017
Address:
Orléans, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
37–40
Language:
French
URL:
https://aclanthology.org/2017.jeptalnrecital-demo.13
DOI:
Bibkey:
Cite (ACL):
Ngoc Tan Le, Fatiha Sadat, and Lucie Ménard. 2017. Translittération automatique pour une paire de langues peu dotée (). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 3 - Démonstrations, pages 37–40, Orléans, France. ATALA.
Cite (Informal):
Translittération automatique pour une paire de langues peu dotée () (Tan Le et al., JEP/TALN/RECITAL 2017)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2017.jeptalnrecital-demo.13.pdf