@inproceedings{garnerin-etal-2020-representation,
title = "Repr{\'e}sentation du genre dans des donn{\'e}es open source de parole (Gender representation in open source speech resources 1 With the rise of artificial intelligence ({AI}) and the growing use of deep-learning architectures, the question of ethics and transparency in {AI} systems has become a central concern within the research community)",
author = "Garnerin, Mahault and
Rossato, Solange and
Besacier, Laurent",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 1 : Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-jep.28/",
pages = "244--252",
language = "fra",
abstract = "Avec l{'}essor de l{'}intelligence artificielle (IA) et l{'}utilisation croissante des architectures d{'}apprentissage profond, la question de l'{\'e}thique et de la transparence des syst{\`e}mes d{'}IA est devenue une pr{\'e}occupation centrale au sein de la communaut{\'e} de recherche. Dans cet article, nous proposons une {\'e}tude sur la repr{\'e}sentation du genre dans les ressources de parole disponibles sur la plateforme Open Speech and Language Resource. Un tout premier r{\'e}sultat est la difficult{\'e} d{'}acc{\`e}s aux informations sur le genre des locuteurs. Ensuite, nous montrons que l'{\'e}quilibre entre les cat{\'e}gories de genre d{\'e}pend de diverses caract{\'e}ristiques des corpus (discours {\'e}licit{\'e} ou non, t{\^a}che adress{\'e}e). En nous appuyant sur des travaux ant{\'e}rieurs, nous reprenons quelques principes concernant les m{\'e}tadonn{\'e}es dans l{'}optique d{'}assurer une meilleure transparence des syst{\`e}mes de parole construits {\`a} l{'}aide de ces corpus."
}