@inproceedings{even-enguehard-2002-extraction,
title = "Extraction d`informations {\`a} partir de corpus d{\'e}grad{\'e}s",
author = "Even, Fabrice and
Enguehard, Chantal",
editor = "Pierrel, Jean-Marie",
booktitle = "Actes de la 9{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2002",
address = "Nancy, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/Author-page-Marten-During-lu/2002.jeptalnrecital-long.8/",
pages = "105--115",
language = "fra",
abstract = "Nous pr{\'e}sentons une m{\'e}thode automatique d`extraction d`information {\`a} partir d`un corpus mono-domaine de mauvaise qualit{\'e}, sur lequel il est impossible d`appliquer les m{\'e}thodes classiques de traitement de la langue naturelle. Cette approche se fonde sur la construction d`une ontologie semi-formelle (mod{\'e}lisant les informations contenues dans le corpus et les relations entre elles). Notre m{\'e}thode se d{\'e}roule en trois phases : 1) la normalisation du corpus, 2) la construction de l`ontologie, et 3) sa formalisation sous la forme d`une grammaire. L`extraction d`information {\`a} proprement parler exploite un {\'e}tiquetage utilisant les r{\`e}gles d{\'e}finies par la grammaire. Nous illustrons notre d{\'e}marche d`une application sur un corpus bancaire."
}
Markdown (Informal)
[Extraction d’informations à partir de corpus dégradés](https://preview.aclanthology.org/Author-page-Marten-During-lu/2002.jeptalnrecital-long.8/) (Even & Enguehard, JEP/TALN/RECITAL 2002)
ACL