@inproceedings{patry-langlais-2005-paradocs,
title = "Paradocs: un syst{\`e}me d`identification automatique de documents parall{\`e}les",
author = "Patry, Alexandre and
Langlais, Philippe",
editor = "Jardino, Mich{\`e}le",
booktitle = "Actes de la 12{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2005",
address = "Dourdan, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2005.jeptalnrecital-long.23/",
pages = "221--230",
language = "fra",
abstract = "Les corpus parall{\`e}les sont d`une importance capitale pour les applications multilingues de traitement automatique des langues. Malheureusement, leur raret{\'e} est le maillon faible de plusieurs applications d`int{\'e}r{\^e}t. Extraire de tels corpus duWeb est une solution viable, mais elle introduit une nouvelle probl{\'e}matique : il n`est pas toujours trivial d`identifier les documents parall{\`e}les parmi tous ceux qui ont {\'e}t{\'e} extraits. Dans cet article, nous nous int{\'e}ressons {\`a} l`identification automatique des paires de documents parall{\`e}les contenues dans un corpus bilingue. Nous montrons que cette t{\^a}che peut {\^e}tre accomplie avec pr{\'e}cision en utilisant un ensemble restreint d`invariants lexicaux. Nous {\'e}valuons {\'e}galement notre approche sur une t{\^a}che de traduction automatique et montrons qu`elle obtient des r{\'e}sultats sup{\'e}rieurs {\`a} un syst{\`e}me de r{\'e}f{\'e}rence faisant usage d`un lexique bilingue."
}
Markdown (Informal)
[Paradocs: un système d’identification automatique de documents parallèles](https://preview.aclanthology.org/jlcl-multiple-ingestion/2005.jeptalnrecital-long.23/) (Patry & Langlais, JEP/TALN/RECITAL 2005)
ACL