@inproceedings{tanguy-2020-exploiter,
title = "Exploiter des mod{\`e}les de langue pour {\'e}valuer des sorties de logiciels d'{OCR} pour des documents fran{\c{c}}ais du {XVII}e si{\`e}cle ()",
author = "Tanguy, Jean-Baptiste",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 3 : Rencontre des {\'E}tudiants Chercheurs en Informatique pour le TAL",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://preview.aclanthology.org/add-emnlp-2024-awards/2020.jeptalnrecital-recital.16/",
pages = "205--217",
language = "fra",
abstract = "Pour comparer deux sorties de logiciels d`OCR, le Character Error Rate (ou, CER) est fr{\'e}quemment utilis{\'e}. Moyennant l`existence d`une transcription de r{\'e}f{\'e}rence de qualit{\'e} pour certains documents du corpus, le CER calcule le taux d`erreurs de ces pi{\`e}ces et permet ensuite de s{\'e}lectionner le logiciel d`OCR le plus adapt{\'e}. Toutefois, ces transcriptions sont tr{\`e}s co{\^u}teuses {\`a} produire et peuvent freiner certaines {\'e}tudes, m{\^e}me prospectives. Nous explorons l`exploitation des mod{\`e}les de langue en agr{\'e}geant selon diff{\'e}rentes m{\'e}thodes les probabilit{\'e}s offertes par ceux-ci pour estimer la qualit{\'e} d`une sortie d`OCR. L`indice de corr{\'e}lation Pearson est ici utilis{\'e} pour comprendre dans quelle mesure ces estimations issues de mod{\`e}les de langue co-varient avec le CER, mesure de r{\'e}f{\'e}rence."
}
Markdown (Informal)
[Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle ()](https://preview.aclanthology.org/add-emnlp-2024-awards/2020.jeptalnrecital-recital.16/) (Tanguy, JEP/TALN/RECITAL 2020)
ACL