Apprentissage discriminant pour les Grammaires à Substitution d’Arbres

Antoine Rozenknop, Jean-Cédric Chappelier, Martin Rajman


Abstract
Les grammaires stochastiques standards utilisent des modèles probabilistes de nature générative, fondés sur des probabilités de récriture conditionnées par le symbole récrit. Les expériences montrent qu’elles tendent ainsi par nature à pénaliser les dérivations les plus longues pour une mˆeme entrée, ce qui n’est pas forcément un comportement souhaitable, ni en analyse syntaxique, ni en reconnaissance de la parole. Dans cet article, nous proposons une approche probabiliste non-générative du modèle STSG (grammaire stochastique à substitution d’arbres), selon laquelle les probabilités sont conditionnées par les feuilles des arbres syntaxiques plutˆot que par leur racine, et qui par nature fait appel à un apprentissage discriminant. Plusieurs expériences sur ce modèle sont présentées.
Anthology ID:
2003.jeptalnrecital-long.21
Volume:
Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2003
Address:
Batz-sur-Mer, France
Editors:
Béatrice Daille, Emmanuel Morin
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
225–234
Language:
French
URL:
https://aclanthology.org/2003.jeptalnrecital-long.21
DOI:
Bibkey:
Cite (ACL):
Antoine Rozenknop, Jean-Cédric Chappelier, and Martin Rajman. 2003. Apprentissage discriminant pour les Grammaires à Substitution d’Arbres. In Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 225–234, Batz-sur-Mer, France. ATALA.
Cite (Informal):
Apprentissage discriminant pour les Grammaires à Substitution d’Arbres (Rozenknop et al., JEP/TALN/RECITAL 2003)
Copy Citation:
PDF:
https://preview.aclanthology.org/improve-issue-templates/2003.jeptalnrecital-long.21.pdf