@inproceedings{level-etal-2020-introduction,
title = "Introduction d{'}informations s{\'e}mantiques dans un syst{\`e}me de reconnaissance de la parole (Despite spectacular advances in recent years, the Automatic Speech Recognition ({ASR}) systems still make mistakes, especially in noisy environments)",
author = "Level, St{\'e}phane and
Illina, Irina and
Fohr, Dominique",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 1 : Journ{\'e}es d'{\'E}tudes sur la Parole",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-jep.41/",
pages = "362--369",
language = "fra",
abstract = "Malgr{\'e} les avanc{\'e}s spectaculaires ces derni{\`e}res ann{\'e}es, les syst{\`e}mes de Reconnaissance Automatique de Parole (RAP) commettent encore des erreurs, surtout dans des environnements bruit{\'e}s. Pour am{\'e}liorer la RAP, nous proposons de se diriger vers une contextualisation d{'}un syst{\`e}me RAP, car les informations s{\'e}mantiques sont importantes pour la performance de la RAP. Les syst{\`e}mes RAP actuels ne prennent en compte principalement que les informations lexicales et syntaxiques. Pour mod{\'e}liser les informations s{\'e}mantiques, nous proposons de d{\'e}tecter les mots de la phrase trait{\'e}e qui pourraient avoir {\'e}t{\'e} mal reconnus et de proposer des mots correspondant mieux au contexte. Cette analyse s{\'e}mantique permettra de r{\'e}{\'e}valuer les N meilleures hypoth{\`e}ses de transcription (N-best). Nous utilisons les embeddings Word2Vec et BERT. Nous avons {\'e}valu{\'e} notre m{\'e}thodologie sur le corpus des conf{\'e}rences TED (TED-LIUM). Les r{\'e}sultats montrent une am{\'e}lioration significative du taux d{'}erreur mots en utilisant la m{\'e}thodologie propos{\'e}e."
}
Markdown (Informal)
[Introduction d’informations sémantiques dans un système de reconnaissance de la parole (Despite spectacular advances in recent years, the Automatic Speech Recognition (ASR) systems still make mistakes, especially in noisy environments)](https://preview.aclanthology.org/fix-sig-urls/2020.jeptalnrecital-jep.41/) (Level et al., JEP/TALN/RECITAL 2020)
ACL
- Stéphane Level, Irina Illina, and Dominique Fohr. 2020. Introduction d’informations sémantiques dans un système de reconnaissance de la parole (Despite spectacular advances in recent years, the Automatic Speech Recognition (ASR) systems still make mistakes, especially in noisy environments). In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, pages 362–369, Nancy, France. ATALA et AFCP.