Création d’un nouveau treebank à partir de quatrièmes de couverture
Philippe Blache, Grégoire Moncheuil, Stéphane Rauzy, Marie-Laure Guénot
Abstract
Nous présentons ici 4-couv, un nouveau corpus arboré d’environ 3 500 phrases, constitué d’un ensemble de quatrièmes de couverture, étiqueté et analysé automatiquement puis corrigé et validé à la main. Il répond à des besoins spécifiques pour des projets de linguistique expérimentale, et vise à rester compatible avec les autres treebanks existants pour le français. Nous présentons ici le corpus lui-même ainsi que les outils utilisés pour les différentes étapes de son élaboration : choix des textes, étiquetage, parsing, correction manuelle.- Anthology ID:
- 2015.jeptalnrecital-court.25
- Volume:
- Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
- Month:
- June
- Year:
- 2015
- Address:
- Caen, France
- Editors:
- Jean-Marc Lecarpentier, Nadine Lucas
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 164–170
- Language:
- URL:
- https://aclanthology.org/2015.jeptalnrecital-court.25
- DOI:
- Cite (ACL):
- Philippe Blache, Grégoire Moncheuil, Stéphane Rauzy, and Marie-Laure Guénot. 2015. Création d’un nouveau treebank à partir de quatrièmes de couverture. In Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 164–170, Caen, France. ATALA.
- Cite (Informal):
- Création d’un nouveau treebank à partir de quatrièmes de couverture (Blache et al., JEP/TALN/RECITAL 2015)
- PDF:
- https://preview.aclanthology.org/ingest-acl-2023-videos/2015.jeptalnrecital-court.25.pdf