@inproceedings{lavigne-etal-2024-optimisation,
title = "Optimisation des performances d{'}un syst{\`e}me de reconnaissance automatique de la parole pour les commentaires sportifs: fine-tuning de Whisper",
author = "Lavigne, Camille and
Stasica, Alex and
Kupsc, Anna",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://preview.aclanthology.org/fix-sig-urls/2024.jeptalnrecital-taln.38/",
pages = "567--581",
language = "fra",
abstract = "Malgr{\'e} les performances {\'e}lev{\'e}es des syst{\`e}mes automatiques de reconnaissance de la parole (Automatic Speech Recognition ; ASR) sur des corpus g{\'e}n{\'e}raux, leur efficacit{\'e} est consid{\'e}rablement r{\'e}duite lorsqu{'}ils sont confront{\'e}s {\`a} des corpus sp{\'e}cialis{\'e}s. Ces corpus peuvent notamment contenir du lexique propre {\`a} des domaines sp{\'e}cifiques, des accents ou du bruit de fond rendant la transcription ardue. Cette {\'e}tude vise {\`a} {\'e}valuer les avantages de l{'}optimisation d{'}une transcription automatique, par opposition {\`a} manuelle, apr{\`e}s fine-tuning d{'}un mod{\`e}le d{'}ASR de derni{\`e}re g{\'e}n{\'e}ration, Whisper (Radford et al., 2023), sur un corpus sp{\'e}cialis{\'e} de commentaires sportifs de petite taille. Nos analyses quantitatives et qualitatives indiquent que Whisper est capable d{'}apprendre les particularit{\'e}s d{'}un corpus de sp{\'e}cialit{\'e}, atteignant des performances {\'e}gales o{\`u} sup{\'e}rieures aux transcripteurs humains, avec cette quantit{\'e} de donn{\'e}es limit{\'e}e. Cette recherche met en lumi{\`e}re le r{\^o}le que l{'}intelligence artificielle, notamment les larges mod{\`e}les de langage, peut jouer pour faciliter la cr{\'e}ation de corpus sp{\'e}cialis{\'e}s."
}
Markdown (Informal)
[Optimisation des performances d’un système de reconnaissance automatique de la parole pour les commentaires sportifs: fine-tuning de Whisper](https://preview.aclanthology.org/fix-sig-urls/2024.jeptalnrecital-taln.38/) (Lavigne et al., JEP/TALN/RECITAL 2024)
ACL