@inproceedings{tanguy-2020-exploiter,
    title = "Exploiter des mod{\`e}les de langue pour {\'e}valuer des sorties de logiciels d'{OCR} pour des documents fran{\c{c}}ais du {XVII}e si{\`e}cle ()",
    author = "Tanguy, Jean-Baptiste",
    editor = "Benzitoun, Christophe  and
      Braud, Chlo{\'e}  and
      Huber, Laurine  and
      Langlois, David  and
      Ouni, Slim  and
      Pogodalla, Sylvain  and
      Schneider, St{\'e}phane",
    booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 3 : Rencontre des {\'E}tudiants Chercheurs en Informatique pour le TAL",
    month = "6",
    year = "2020",
    address = "Nancy, France",
    publisher = "ATALA et AFCP",
    url = "https://preview.aclanthology.org/ingest-emnlp/2020.jeptalnrecital-recital.16/",
    pages = "205--217",
    language = "fra",
    abstract = "Pour comparer deux sorties de logiciels d{'}OCR, le Character Error Rate (ou, CER) est fr{\'e}quemment utilis{\'e}. Moyennant l{'}existence d{'}une transcription de r{\'e}f{\'e}rence de qualit{\'e} pour certains documents du corpus, le CER calcule le taux d{'}erreurs de ces pi{\`e}ces et permet ensuite de s{\'e}lectionner le logiciel d{'}OCR le plus adapt{\'e}. Toutefois, ces transcriptions sont tr{\`e}s co{\^u}teuses {\`a} produire et peuvent freiner certaines {\'e}tudes, m{\^e}me prospectives. Nous explorons l{'}exploitation des mod{\`e}les de langue en agr{\'e}geant selon diff{\'e}rentes m{\'e}thodes les probabilit{\'e}s offertes par ceux-ci pour estimer la qualit{\'e} d{'}une sortie d{'}OCR. L{'}indice de corr{\'e}lation Pearson est ici utilis{\'e} pour comprendre dans quelle mesure ces estimations issues de mod{\`e}les de langue co-varient avec le CER, mesure de r{\'e}f{\'e}rence."
}Markdown (Informal)
[Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle ()](https://preview.aclanthology.org/ingest-emnlp/2020.jeptalnrecital-recital.16/) (Tanguy, JEP/TALN/RECITAL 2020)
ACL