Un analyseur de surface non déterministe pour le français

François Trouilleux


Abstract
Les analyseurs syntaxiques de surface à base de règles se caractérisent par un processus en deux temps : désambiguïsation lexicale, puis reconnaissance de patrons. Considérant que ces deux étapes introduisent une certaine redondance dans la description linguistique et une dilution des heuristiques dans les différents processus, nous proposons de définir un analyseur de surface qui fonctionne sur une entrée non désambiguïsée et produise l’ensemble des analyses possibles en termes de syntagmes noyau (chunks). L’analyseur, implanté avec NooJ, repose sur la définition de patrons étendus qui annotent des séquences de syntagmes noyau. Les résultats obtenus sur un corpus de développement d’environ 22 500 mots, avec un rappel proche de 100 %, montrent la faisabilité de l’approche et signalent quelques points d’ambiguïté à étudier plus particulièrement pour améliorer la précision.
Anthology ID:
2009.jeptalnrecital-long.24
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2009
Address:
Senlis, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
231–240
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-long.24
DOI:
Bibkey:
Cite (ACL):
François Trouilleux. 2009. Un analyseur de surface non déterministe pour le français. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 231–240, Senlis, France. ATALA.
Cite (Informal):
Un analyseur de surface non déterministe pour le français (Trouilleux, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2009.jeptalnrecital-long.24.pdf