Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables

Vincent Archer


Abstract
Cet article présente une méthode d’acquisition semi-automatique de collocations. Notre extraction monolingue estime pour chaque co-occurrence sa capacité à être une collocation, d’après une mesure statistique modélisant une caractéristique essentielle (le fait qu’une collocation se produit plus souvent que par hasard), effectue ensuite un filtrage automatique (en utilisant les vecteurs conceptuels) pour ne retenir que des collocations d’un certain type sémantique, puis effectue enfin un nouveau filtrage à partir de données entrées manuellement. Notre extraction bilingue est effectuée à partir de corpus comparables, et a pour but d’extraire des collocations qui ne soient pas forcément traductions mot à mot l’une de l’autre. Notre évaluation démontre l’intérêt de mêler extraction automatique et intervention manuelle pour acquérir des collocations et ainsi permettre de compléter les bases lexicales multilingues.
Anthology ID:
2006.jeptalnrecital-recital.1
Volume:
Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
April
Year:
2006
Address:
Leuven, Belgique
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
651–660
Language:
French
URL:
https://aclanthology.org/2006.jeptalnrecital-recital.1
DOI:
Bibkey:
Cite (ACL):
Vincent Archer. 2006. Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables. In Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 651–660, Leuven, Belgique. ATALA.
Cite (Informal):
Acquisition semi-automatique de collocations à partir de corpus monolingues et multilingues comparables (Archer, JEP/TALN/RECITAL 2006)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2006.jeptalnrecital-recital.1.pdf