Abstract
Les grammaires stochastiques standards utilisent des modèles probabilistes de nature générative, fondés sur des probabilités de récriture conditionnées par le symbole récrit. Les expériences montrent qu’elles tendent ainsi par nature à pénaliser les dérivations les plus longues pour une meme entrée, ce qui n’est pas forcément un comportement souhaitable, ni en analyse syntaxique, ni en reconnaissance de la parole. Dans cet article, nous proposons une approche probabiliste non-générative du modèle STSG (grammaire stochastique à substitution d’arbres), selon laquelle les probabilités sont conditionnées par les feuilles des arbres syntaxiques plutot que par leur racine, et qui par nature fait appel à un apprentissage discriminant. Plusieurs expériences sur ce modèle sont présentées.- Anthology ID:
- 2003.jeptalnrecital-long.21
- Volume:
- Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- June
- Year:
- 2003
- Address:
- Batz-sur-Mer, France
- Editors:
- Béatrice Daille, Emmanuel Morin
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 225–234
- Language:
- French
- URL:
- https://aclanthology.org/2003.jeptalnrecital-long.21
- DOI:
- Cite (ACL):
- Antoine Rozenknop, Jean-Cédric Chappelier, and Martin Rajman. 2003. Apprentissage discriminant pour les Grammaires à Substitution d’Arbres. In Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 225–234, Batz-sur-Mer, France. ATALA.
- Cite (Informal):
- Apprentissage discriminant pour les Grammaires à Substitution d’Arbres (Rozenknop et al., JEP/TALN/RECITAL 2003)
- PDF:
- https://preview.aclanthology.org/improve-issue-templates/2003.jeptalnrecital-long.21.pdf