Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French )

Thomas Pellegrini; Lionel Fontan; Halima Sahraoui

Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French )

Thomas Pellegrini, Lionel Fontan, Halima Sahraoui

Abstract

Dans cet article, nous comparons deux approches d’évaluation automatique de la prononciation de locuteurs japonophones apprenant le français. La première, l’algorithme standard appelé Goodness Of Pronunciation (GOP), compare les vraisemblances obtenues lors d’un alignement forcé et lors d’une reconnaissance de phones sans contrainte. La deuxième, nécessitant également un alignement préalable, fait appel à un réseau de neurones convolutif (CNN) comme classifieur binaire, avec comme entrée des trames de coefficients spectraux. Les deux approches sont évaluées sur deux phonèmes cibles /R/ et /v/ du français, particulièrement difficiles à prononcer pour des Japonophones. Les paramètres du GOP (seuils) et du CNN sont estimés sur un corpus de parole lue par des locuteurs natifs du français, dans lequel des erreurs de prononciation artificielles sont introduites. Un gain de performance relatif de 13,4% a été obtenu avec le CNN, avec une précision globale de 72,6%, sur un corpus d’évaluation enregistré par 23 locuteurs japonophones.

Anthology ID:: 2016.jeptalnrecital-jep.70
Volume:: Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP
Month:: 7
Year:: 2016
Address:: Paris, France
Editors:: Laurence Danlos, Thierry Hamon
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: AFCP - ATALA
Note:
Pages:: 624–632
Language:: French
URL:: https://aclanthology.org/2016.jeptalnrecital-jep.70
DOI:
Bibkey:
Cite (ACL):: Thomas Pellegrini, Lionel Fontan, and Halima Sahraoui. 2016. Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French ). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 1 : JEP, pages 624–632, Paris, France. AFCP - ATALA.
Cite (Informal):: Réseau de neurones convolutif pour l’évaluation automatique de la prononciation (CNN-based automatic pronunciation assessment of Japanese speakers learning French ) (Pellegrini et al., JEP/TALN/RECITAL 2016)
Copy Citation:
PDF:: https://preview.aclanthology.org/naacl24-info/2016.jeptalnrecital-jep.70.pdf

PDF Search