@inproceedings{bourigault-frerot-2005-acquisition,
title = "Acquisition et {\'e}valuation sur corpus de propri{\'e}t{\'e}s de sous-cat{\'e}gorisation syntaxique",
author = "Bourigault, Didier and
Fr{\'e}rot, C{\'e}cile",
editor = "Jardino, Mich{\`e}le",
booktitle = "Actes de la 12{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2005",
address = "Dourdan, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/add-emnlp-2024-awards/2005.jeptalnrecital-long.38/",
pages = "371--380",
language = "fra",
abstract = {Cette {\'e}tude est men{\'e}e dans le cadre du d{\'e}veloppement de l`analyseur syntaxique de corpus Syntex et porte sur la t{\^a}che de d{\'e}sambigu{\"i}sation des rattachements pr{\'e}positionnels. Les donn{\'e}es de sous-cat{\'e}gorisation syntaxique exploit{\'e}es par Syntex pour la d{\'e}sambigu{\"i}sation se pr{\'e}sentent sous la forme de probabilit{\'e}s de sous-cat{\'e}gorisation (que telle unit{\'e} lexicale - verbe, nom ou adjectif - se construise avec telle pr{\'e}position). Elles sont acquises automatiquement {\`a} partir d`un corpus de 200 millions de mots, {\'e}tiquet{\'e} et partiellement analys{\'e} syntaxiquement. Pour {\'e}valuer ces donn{\'e}es, nous utilisons 4 corpus de test de genres vari{\'e}s, sur lesquels nous avons annot{\'e} {\`a} la main plusieurs centaines de cas de rattachement pr{\'e}positionnels ambigus. Nous testons plusieurs strat{\'e}gies de d{\'e}sambigu{\"i}sation, une strat{\'e}gie de base, une strat{\'e}gie endog{\`e}ne qui exploite des propri{\'e}t{\'e}s de sous-cat{\'e}gorisation sp{\'e}cifiques acquises {\`a} partir du corpus en cours de traitement, une strat{\'e}gie exog{\`e}ne qui exploite des propri{\'e}t{\'e}s de sous-cat{\'e}gorisation g{\'e}n{\'e}riques acquises {\`a} partir du corpus de 200 millions de mots, et enfin une strat{\'e}gie mixte qui utilisent les deux types de ressources. L`analyse des r{\'e}sultats montre que la strat{\'e}gie mixte est la meilleure, et que les performances de l`analyseur sur la t{\^a}che de d{\'e}sambigu{\"i}sation des rattachements pr{\'e}positionnels varient selon les corpus de 79.4 {\%} {\`a} 87.2 {\%}.}
}
Markdown (Informal)
[Acquisition et évaluation sur corpus de propriétés de sous-catégorisation syntaxique](https://preview.aclanthology.org/add-emnlp-2024-awards/2005.jeptalnrecital-long.38/) (Bourigault & Frérot, JEP/TALN/RECITAL 2005)
ACL