Pauzee : Prédiction des pauses dans la lecture d’un texte

Marion Baranes, Karl Hayek, Romain Hennequin, Elena V. Epure


Abstract
Les pauses silencieuses jouent un rôle crucial en synthèse vocale où elles permettent d’obtenir un rendu plus naturel. Dans ce travail, notre objectif consiste à prédire ces pauses silencieuses, à partir de textes, afin d’améliorer les systèmes de lecture automatique. Cette tâche n’ayant pas fait l’objet de nombreuses études pour le français, constituer des données d’apprentissage dédiées à la prédiction de pauses est nécessaire. Nous proposons une stratégie d’inférence de pauses, reposant sur des informations temporelles issues de données orales transcrites, afin d’obtenir un tel corpus. Nous montrons ensuite qu’à l’aide d’un modèle basé sur des transformeurs et des données adaptées, il est possible d’obtenir des résultats prometteurs pour la prédiction des pauses produites par un locuteur lors de la lecture d’un document.
Anthology ID:
2023.jeptalnrecital-long.4
Volume:
Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs
Month:
6
Year:
2023
Address:
Paris, France
Editors:
Christophe Servan, Anne Vilnat
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
43–55
Language:
French
URL:
https://aclanthology.org/2023.jeptalnrecital-long.4
DOI:
Bibkey:
Cite (ACL):
Marion Baranes, Karl Hayek, Romain Hennequin, and Elena V. Epure. 2023. Pauzee : Prédiction des pauses dans la lecture d’un texte. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : travaux de recherche originaux -- articles longs, pages 43–55, Paris, France. ATALA.
Cite (Informal):
Pauzee : Prédiction des pauses dans la lecture d’un texte (Baranes et al., JEP/TALN/RECITAL 2023)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2023.jeptalnrecital-long.4.pdf