@inproceedings{chignoli-etal-2020-caracterisation,
title = "Caract{\'e}risation du locuteur par {CNN} {\`a} l{'}aide des contours d{'}intensit{\'e} et d{'}intonation : comparaison avec le spectrogramme ({CNN} speaker characterisation through prosody : spectrogram comparison )",
author = "Chignoli, Gabriele and
Gendrot, C{\'e}dric and
Ferragne, Emmanuel",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 1 : Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-jep.11",
pages = "91--99",
abstract = "Dans ce travail nous avons recours aux variations de f0 et d{'}intensit{\'e} de 44 locuteurs francophones {\`a} partir de s{\'e}quences de 4 secondes de parole spontan{\'e}e pour comprendre comment ces param{\`e}tres prosodiques peuvent {\^e}tre utilis{\'e}s pour caract{\'e}riser des locuteurs. Une classification automatique est effectu{\'e}e avec un r{\'e}seau de neurones convolutifs, fournissant comme r{\'e}ponse des scores de probabilit{\'e} pour chacun des 44 locuteurs mod{\'e}lis{\'e}s. Une repr{\'e}sentation par spectrogrammes a {\'e}t{\'e} utilis{\'e}e comme r{\'e}f{\'e}rence pour le m{\^e}me syst{\`e}me de classification. Nous avons pu mettre en avant la pertinence de l{'}intensit{\'e}, et lorsque les deux param{\`e}tres prosodiques sont combin{\'e}s pour repr{\'e}senter les locuteurs nous observons un score qui atteint en moyenne 59 {\%} de bonnes classifications.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="chignoli-etal-2020-caracterisation">
<titleInfo>
<title>Caractérisation du locuteur par CNN à l’aide des contours d’intensité et d’intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Gabriele</namePart>
<namePart type="family">Chignoli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cédric</namePart>
<namePart type="family">Gendrot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Ferragne</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2020-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d’Études sur la Parole</title>
</titleInfo>
<originInfo>
<publisher>ATALA et AFCP</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans ce travail nous avons recours aux variations de f0 et d’intensité de 44 locuteurs francophones à partir de séquences de 4 secondes de parole spontanée pour comprendre comment ces paramètres prosodiques peuvent être utilisés pour caractériser des locuteurs. Une classification automatique est effectuée avec un réseau de neurones convolutifs, fournissant comme réponse des scores de probabilité pour chacun des 44 locuteurs modélisés. Une représentation par spectrogrammes a été utilisée comme référence pour le même système de classification. Nous avons pu mettre en avant la pertinence de l’intensité, et lorsque les deux paramètres prosodiques sont combinés pour représenter les locuteurs nous observons un score qui atteint en moyenne 59 % de bonnes classifications.</abstract>
<identifier type="citekey">chignoli-etal-2020-caracterisation</identifier>
<location>
<url>https://aclanthology.org/2020.jeptalnrecital-jep.11</url>
</location>
<part>
<date>2020-6</date>
<extent unit="page">
<start>91</start>
<end>99</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Caractérisation du locuteur par CNN à l’aide des contours d’intensité et d’intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )
%A Chignoli, Gabriele
%A Gendrot, Cédric
%A Ferragne, Emmanuel
%S Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d’Études sur la Parole
%D 2020
%8 June
%I ATALA et AFCP
%C Nancy, France
%G French
%F chignoli-etal-2020-caracterisation
%X Dans ce travail nous avons recours aux variations de f0 et d’intensité de 44 locuteurs francophones à partir de séquences de 4 secondes de parole spontanée pour comprendre comment ces paramètres prosodiques peuvent être utilisés pour caractériser des locuteurs. Une classification automatique est effectuée avec un réseau de neurones convolutifs, fournissant comme réponse des scores de probabilité pour chacun des 44 locuteurs modélisés. Une représentation par spectrogrammes a été utilisée comme référence pour le même système de classification. Nous avons pu mettre en avant la pertinence de l’intensité, et lorsque les deux paramètres prosodiques sont combinés pour représenter les locuteurs nous observons un score qui atteint en moyenne 59 % de bonnes classifications.
%U https://aclanthology.org/2020.jeptalnrecital-jep.11
%P 91-99
Markdown (Informal)
[Caractérisation du locuteur par CNN à l’aide des contours d’intensité et d’intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison )](https://aclanthology.org/2020.jeptalnrecital-jep.11) (Chignoli et al., JEP/TALN/RECITAL 2020)
ACL
- Gabriele Chignoli, Cédric Gendrot, and Emmanuel Ferragne. 2020. Caractérisation du locuteur par CNN à l’aide des contours d’intensité et d’intonation : comparaison avec le spectrogramme (CNN speaker characterisation through prosody : spectrogram comparison ). In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, pages 91–99, Nancy, France. ATALA et AFCP.