Abstract
Cet article présente les premiers résultats d’une campagne d’annotation de corpus à grande échelle réalisée dans le cadre du projet ANNODIS. Ces résultats concernent la partie descendante du dispositif d’annotation, et plus spécifiquement les structures énumératives. Nous nous intéressons à la structuration énumérative en tant que stratégie de base de mise en texte, apparaissant à différents niveaux de granularité, associée à différentes fonctions discursives, et signalée par des indices divers. Avant l’annotation manuelle, une étape de pré-traitement a permis d’obtenir le marquage systématique de traits associés à la signalisation de l’organisation du discours. Nous décrivons cette étape de marquage automatique, ainsi que la procédure d’annotation. Nous proposons ensuite une première typologie des structures énumératives basée sur la description quantitative des données annotées manuellement, prenant en compte la couverture textuelle, la composition et les types d’indices.- Anthology ID:
- 2010.jeptalnrecital-long.16
- Volume:
- Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
- Month:
- July
- Year:
- 2010
- Address:
- Montréal, Canada
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 151–160
- Language:
- French
- URL:
- https://aclanthology.org/2010.jeptalnrecital-long.16
- DOI:
- Cite (ACL):
- Lydia-Mai Ho-Dac, Marie-Paule Péry-Woodley, and Ludovic Tanguy. 2010. Anatomie des structures énumératives. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 151–160, Montréal, Canada. ATALA.
- Cite (Informal):
- Anatomie des structures énumératives (Ho-Dac et al., JEP/TALN/RECITAL 2010)
- PDF:
- https://preview.aclanthology.org/ingestion-script-update/2010.jeptalnrecital-long.16.pdf