@inproceedings{sun-etal-2024-creation,
    title = "Cr{\'e}ation d{'}un corpus parall{\`e}le de styles de parole en mandarin via l{'}auto-transcription et l{'}alignement forc{\'e}",
    author = "Sun, Jingyi  and
      Wu, Yaru  and
      Audibert, Nicolas  and
      Adda-Decker, Martine",
    editor = "Balaguer, Mathieu  and
      Bendahman, Nihed  and
      Ho-dac, Lydia-Mai  and
      Mauclair, Julie  and
      G Moreno, Jose  and
      Pinquier, Julien",
    booktitle = "Actes des 35{\`e}mes Journ{\'e}es d'{\'E}tudes sur la Parole",
    month = "7",
    year = "2024",
    address = "Toulouse, France",
    publisher = "ATALA and AFPC",
    url = "https://preview.aclanthology.org/ingest-emnlp/2024.jeptalnrecital-jep.30/",
    pages = "291--300",
    language = "fra",
    abstract = "La technologie ASR excelle dans la transcription pr{\'e}cise des discours lus pr{\'e}par{\'e}s, mais elle rencontre encore des d{\'e}fis lorsqu{'}il s{'}agit de conversations spontan{\'e}es. Cela est en partie d{\^u} au fait que ces derni{\`e}res rel{\`e}vent d{'}un registre de langage informel, avec disfluences et r{\'e}ductions de parole. Afin de mieux comprendre les diff{\'e}rences de production en fonction des styles de parole, nous pr{\'e}sentons la cr{\'e}ation d{'}un corpus de parole conversationnelle, dont des extraits sont ensuite lus par leurs auteurs. Le corpus comprend 36 heures de parole en chinois mandarin avec leur transcription, r{\'e}parties entre conversations spontan{\'e}es et lecture. Nous avons utilis{\'e} WHISPER pour la transcription automatique de la parole et le Montreal Forced Aligner pour l{'}alignement forc{\'e}, r{\'e}sultant dans un corpus de parole transcrit avec annotations multi-niveaux incluant phon{\`e}mes, caract{\`e}res/syllabes et mots. De telles productions de parole parall{\`e}les (en modes spontan{\'e} et lu) seront particuli{\`e}rement int{\'e}ressantes pour l'{\'e}tude des r{\'e}ductions temporelles."
}Markdown (Informal)
[Création d’un corpus parallèle de styles de parole en mandarin via l’auto-transcription et l’alignement forcé](https://preview.aclanthology.org/ingest-emnlp/2024.jeptalnrecital-jep.30/) (Sun et al., JEP/TALN/RECITAL 2024)
ACL