@inproceedings{raymond-fayolle-2010-reconnaissance,
title = "Reconnaissance robuste d{'}entit{\'e}s nomm{\'e}es sur de la parole transcrite automatiquement",
author = "Raymond, Christian and
Fayolle, Julien",
editor = "Langlais, Philippe and
Gagnon, Michel",
booktitle = "Actes de la 17e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jul,
year = "2010",
address = "Montr{\'e}al, Canada",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2010.jeptalnrecital-long.20/",
pages = "191--200",
language = "fra",
abstract = "Les transcriptions automatiques de parole constituent une ressource importante, mais souvent bruit{\'e}e, pour d{\'e}crire des documents multim{\'e}dia contenant de la parole (e.g. journaux t{\'e}l{\'e}vis{\'e}s). En vue d{'}am{\'e}liorer la recherche documentaire, une {\'e}tape d{'}extraction d{'}information {\`a} caract{\`e}re s{\'e}mantique, pr{\'e}c{\'e}dant l{'}indexation, permet de faire face au probl{\`e}me des transcriptions imparfaites. Parmis ces contenus informatifs, on compte les entit{\'e}s nomm{\'e}es (e.g. noms de personnes) dont l{'}extraction est l{'}objet de ce travail. Les m{\'e}thodes traditionnelles de reconnaissance bas{\'e}es sur une d{\'e}finition manuelle de grammaires formelles donnent de bons r{\'e}sultats sur du texte ou des transcriptions propres manuellement produites, mais leurs performances se trouvent fortement affect{\'e}es lorsqu{'}elles sont appliqu{\'e}es sur des transcriptions automatiques. Nous pr{\'e}sentons, ici, trois m{\'e}thodes pour la reconnaissance d{'}entit{\'e}s nomm{\'e}es bas{\'e}es sur des algorithmes d{'}apprentissage automatique : les champs conditionnels al{\'e}atoires, les machines {\`a} de support, et les transducteurs {\`a} {\'e}tats finis. Nous pr{\'e}sentons {\'e}galement une m{\'e}thode pour rendre consistantes les donn{\'e}es d{'}entrainement lorsqu{'}elles sont annot{\'e}es suivant des conventions l{\'e}g{\`e}rement diff{\'e}rentes. Les r{\'e}sultats montrent que les syst{\`e}mes d'{\'e}tiquetage obtenus sont parmi les plus robustes sur les donn{\'e}es d'{\'e}valuation de la campagne ESTER 2 dans les conditions o{\`u} la transcription automatique est particuli{\`e}rement bruit{\'e}e."
}
Markdown (Informal)
[Reconnaissance robuste d’entités nommées sur de la parole transcrite automatiquement](https://preview.aclanthology.org/fix-sig-urls/2010.jeptalnrecital-long.20/) (Raymond & Fayolle, JEP/TALN/RECITAL 2010)
ACL