Alignement de séquences phonétiques pour une analyse phonologique des erreurs de transcription automatique (Phonetic sequences alignment for a phonemic analysis of automatic speech transcription errors )

Camille Dutrey, Martine Adda-Decker, Naomi Yamaguchi


Abstract
La transcription automatique de la parole obtient aujourd’hui des performances élevées avec des taux d’erreur qui tombent facilement en dessous de 10% pour une parole journalistique. Cependant, pour des conversations plus libres, ils stagnent souvent autour de 20–30%. En français, une grande partie des erreurs sont dues à des confusions entre homophones n’impliquant pas les niveaux acousticophonétique et phonologique. Cependant, de nombreuses erreurs peuvent s’expliquer par des variantes de productions non prévues par le système. Afin de mieux comprendre quels processus phonologiques pourraient expliquer ces variantes spécifiques de la parole spontanée, nous proposons une analyse des erreurs en comparant prononciations attendue (référence) et reconnue (hypothèse) via un alignement phonétique par programmation dynamique. Les distances locales entre paires de phonèmes appariés correspondent au nombre de traits phonétiques disjoints. Nos analyses permettent d’identifier les traits phonétiques les plus fréquemment impliqués dans les erreurs et donnent des pistes pour des interprétations phonologiques.
Anthology ID:
2016.jeptalnrecital-jep.6
Volume:
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP
Month:
7
Year:
2016
Address:
Paris, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
AFCP - ATALA
Note:
Pages:
46–54
Language:
French
URL:
https://aclanthology.org/2016.jeptalnrecital-jep.6
DOI:
Bibkey:
Cite (ACL):
Camille Dutrey, Martine Adda-Decker, and Naomi Yamaguchi. 2016. Alignement de séquences phonétiques pour une analyse phonologique des erreurs de transcription automatique (Phonetic sequences alignment for a phonemic analysis of automatic speech transcription errors ). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP, pages 46–54, Paris, France. AFCP - ATALA.
Cite (Informal):
Alignement de séquences phonétiques pour une analyse phonologique des erreurs de transcription automatique (Phonetic sequences alignment for a phonemic analysis of automatic speech transcription errors ) (Dutrey et al., JEP/TALN/RECITAL 2016)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2016.jeptalnrecital-jep.6.pdf