@inproceedings{sun-etal-2024-creation,
title = "Cr{\'e}ation d`un corpus parall{\`e}le de styles de parole en mandarin via l`auto-transcription et l`alignement forc{\'e}",
author = "Sun, Jingyi and
Wu, Yaru and
Audibert, Nicolas and
Adda-Decker, Martine",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes des 35{\`e}mes Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://preview.aclanthology.org/add-emnlp-2024-awards/2024.jeptalnrecital-jep.30/",
pages = "291--300",
language = "fra",
abstract = "La technologie ASR excelle dans la transcription pr{\'e}cise des discours lus pr{\'e}par{\'e}s, mais elle rencontre encore des d{\'e}fis lorsqu`il s`agit de conversations spontan{\'e}es. Cela est en partie d{\^u} au fait que ces derni{\`e}res rel{\`e}vent d`un registre de langage informel, avec disfluences et r{\'e}ductions de parole. Afin de mieux comprendre les diff{\'e}rences de production en fonction des styles de parole, nous pr{\'e}sentons la cr{\'e}ation d`un corpus de parole conversationnelle, dont des extraits sont ensuite lus par leurs auteurs. Le corpus comprend 36 heures de parole en chinois mandarin avec leur transcription, r{\'e}parties entre conversations spontan{\'e}es et lecture. Nous avons utilis{\'e} WHISPER pour la transcription automatique de la parole et le Montreal Forced Aligner pour l`alignement forc{\'e}, r{\'e}sultant dans un corpus de parole transcrit avec annotations multi-niveaux incluant phon{\`e}mes, caract{\`e}res/syllabes et mots. De telles productions de parole parall{\`e}les (en modes spontan{\'e} et lu) seront particuli{\`e}rement int{\'e}ressantes pour l'{\'e}tude des r{\'e}ductions temporelles."
}
Markdown (Informal)
[Création d’un corpus parallèle de styles de parole en mandarin via l’auto-transcription et l’alignement forcé](https://preview.aclanthology.org/add-emnlp-2024-awards/2024.jeptalnrecital-jep.30/) (Sun et al., JEP/TALN/RECITAL 2024)
ACL