@inproceedings{magallon-etal-2018-detection,
title = "D{\'e}tection d{'}erreurs dans des transcriptions {OCR} de documents historiques par r{\'e}seaux de neurones r{\'e}currents multi-niveau (Combining character level and word level {RNN}s for post-{OCR} error detection)",
author = "Magallon, Thibault and
Bechet, Frederic and
Favre, Benoit",
booktitle = "Actes de la Conf{\'e}rence TALN. Volume 1 - Articles longs, articles courts de TALN",
month = "5",
year = "2018",
address = "Rennes, France",
publisher = "ATALA",
url = "https://aclanthology.org/2018.jeptalnrecital-court.5",
pages = "233--240",
abstract = "Le traitement {\`a} posteriori de transcriptions OCR cherche {\`a} d{\'e}tecter les erreurs dans les sorties d{'}OCR pour tenter de les corriger, deux t{\^a}ches {\'e}valu{\'e}es par la comp{\'e}tition ICDAR-2017 Post-OCR Text Correction. Nous pr{\'e}senterons dans ce papier un syst{\`e}me de d{\'e}tection d{'}erreurs bas{\'e} sur un mod{\`e}le {\`a} r{\'e}seaux r{\'e}currents combinant une analyse du texte au niveau des mots et des caract{\`e}res en deux temps. Ce syst{\`e}me a {\'e}t{\'e} class{\'e} second dans trois cat{\'e}gories {\'e}valu{\'e}es parmi 11 candidats lors de la comp{\'e}tition.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="magallon-etal-2018-detection">
<titleInfo>
<title>Détection d’erreurs dans des transcriptions OCR de documents historiques par réseaux de neurones récurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Thibault</namePart>
<namePart type="family">Magallon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Frederic</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2018-05</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN</title>
</titleInfo>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Rennes, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Le traitement à posteriori de transcriptions OCR cherche à détecter les erreurs dans les sorties d’OCR pour tenter de les corriger, deux tâches évaluées par la compétition ICDAR-2017 Post-OCR Text Correction. Nous présenterons dans ce papier un système de détection d’erreurs basé sur un modèle à réseaux récurrents combinant une analyse du texte au niveau des mots et des caractères en deux temps. Ce système a été classé second dans trois catégories évaluées parmi 11 candidats lors de la compétition.</abstract>
<identifier type="citekey">magallon-etal-2018-detection</identifier>
<location>
<url>https://aclanthology.org/2018.jeptalnrecital-court.5</url>
</location>
<part>
<date>2018-5</date>
<extent unit="page">
<start>233</start>
<end>240</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection d’erreurs dans des transcriptions OCR de documents historiques par réseaux de neurones récurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)
%A Magallon, Thibault
%A Bechet, Frederic
%A Favre, Benoit
%S Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
%D 2018
%8 May
%I ATALA
%C Rennes, France
%G French
%F magallon-etal-2018-detection
%X Le traitement à posteriori de transcriptions OCR cherche à détecter les erreurs dans les sorties d’OCR pour tenter de les corriger, deux tâches évaluées par la compétition ICDAR-2017 Post-OCR Text Correction. Nous présenterons dans ce papier un système de détection d’erreurs basé sur un modèle à réseaux récurrents combinant une analyse du texte au niveau des mots et des caractères en deux temps. Ce système a été classé second dans trois catégories évaluées parmi 11 candidats lors de la compétition.
%U https://aclanthology.org/2018.jeptalnrecital-court.5
%P 233-240
Markdown (Informal)
[Détection d’erreurs dans des transcriptions OCR de documents historiques par réseaux de neurones récurrents multi-niveau (Combining character level and word level RNNs for post-OCR error detection)](https://aclanthology.org/2018.jeptalnrecital-court.5) (Magallon et al., JEP/TALN/RECITAL 2018)
ACL