@inproceedings{wisniewski-etal-2010-recueil,
title = "Recueil et analyse d`un corpus {\'e}cologique de corrections orthographiques extrait des r{\'e}visions de Wikip{\'e}dia",
author = "Wisniewski, Guillaume and
Max, Aur{\'e}lien and
Yvon, Fran{\c{c}}ois",
editor = "Langlais, Philippe and
Gagnon, Michel",
booktitle = "Actes de la 17e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jul,
year = "2010",
address = "Montr{\'e}al, Canada",
publisher = "ATALA",
url = "https://preview.aclanthology.org/add-emnlp-2024-awards/2010.jeptalnrecital-long.13/",
pages = "121--130",
language = "fra",
abstract = "Dans cet article, nous introduisons une m{\'e}thode {\`a} base de r{\`e}gles permettant d`extraire automatiquement de l`historique des {\'e}ditions de l`encyclop{\'e}die collaborative Wikip{\'e}dia des corrections orthographiques. Cette m{\'e}thode nous a permis de construire un corpus d`erreurs compos{\'e} de 72 483 erreurs lexicales (non-word errors) et 74 100 erreurs grammaticales (real-word errors). Il n`existe pas, {\`a} notre connaissance, de plus gros corpus d`erreurs {\'e}cologiques librement disponible. En outre, les techniques mises en oeuvre peuvent {\^e}tre facilement transpos{\'e}es {\`a} de nombreuses autres langues. La collecte de ce corpus ouvre de nouvelles perspectives pour l'{\'e}tude des erreurs fr{\'e}quentes ainsi que l`apprentissage et l'{\'e}valuation des correcteurs orthographiques automatiques. Plusieurs exp{\'e}riences illustrant son int{\'e}r{\^e}t sont propos{\'e}es."
}
Markdown (Informal)
[Recueil et analyse d’un corpus écologique de corrections orthographiques extrait des révisions de Wikipédia](https://preview.aclanthology.org/add-emnlp-2024-awards/2010.jeptalnrecital-long.13/) (Wisniewski et al., JEP/TALN/RECITAL 2010)
ACL