@inproceedings{dahmani-etal-2020-etude,
title = "{\'E}tude comparative des param{\`e}tres d{'}entr{\'e}e pour la synth{\`e}se expressive audiovisuelle de la parole par {DNN}s (Comparative study of input parameters for {DNN}-based expressive audiovisual speech synthesis )",
author = "Dahmani, Sara and
Colotte, Vincent and
Ouni, Slim",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 1 : Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-jep.15/",
pages = "127--135",
language = "fra",
abstract = "Dans le pass{\'e}, les descripteurs contextuels pour la synth{\`e}se de la parole acoustique ont {\'e}t{\'e} {\'e}tudi{\'e}s pour l{'}entra{\^i}nement des syst{\`e}mes bas{\'e}s sur des HMMs. Dans ce travail, nous {\'e}tudions l{'}impact de ces facteurs pour la synth{\`e}se de la parole audiovisuelle par DNNs. Nous analysons cet impact pour les trois aspects de la parole : la modalit{\'e} acoustique, la modalit{\'e} visuelle et les dur{\'e}es des phon{\`e}mes. Nous {\'e}tudions {\'e}galement l{'}apport d{'}un entra{\^i}nement joint et s{\'e}par{\'e} des deux modalit{\'e}s acoustique et visuelle sur la qualit{\'e} de la parole synth{\'e}tique g{\'e}n{\'e}r{\'e}e. Finalement, nous proc{\'e}dons {\`a} une validation crois{\'e}e entre les r{\'e}sultats de la synth{\`e}se des diff{\'e}rentes {\'e}motions. Cette validation crois{\'e}e, nous a permis de v{\'e}rifier la capacit{\'e} des DNNs {\`a} apprendre des caract{\'e}ristiques sp{\'e}cifiques {\`a} chaque {\'e}motion."
}
Markdown (Informal)
[Étude comparative des paramètres d’entrée pour la synthèse expressive audiovisuelle de la parole par DNNs (Comparative study of input parameters for DNN-based expressive audiovisual speech synthesis )](https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-jep.15/) (Dahmani et al., JEP/TALN/RECITAL 2020)
ACL
- Sara Dahmani, Vincent Colotte, and Slim Ouni. 2020. Étude comparative des paramètres d’entrée pour la synthèse expressive audiovisuelle de la parole par DNNs (Comparative study of input parameters for DNN-based expressive audiovisual speech synthesis ). In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, pages 127–135, Nancy, France. ATALA et AFCP.