Annotation d’expressions polylexicales verbales en français (Annotation of verbal multiword expressions in French)

Marie Candito, Mathieu Constant, Carlos Ramisch, Agata Savary, Yannick Parmentier, Caroline Pasquer, Jean-Yves Antoine


Abstract
Nous décrivons la partie française des données produites dans le cadre de la campagne multilingue PARSEME sur l’identification d’expressions polylexicales verbales (Savary et al., 2017). Les expressions couvertes pour le français sont les expressions verbales idiomatiques, les verbes intrinsèquement pronominaux et une généralisation des constructions à verbe support. Ces phénomènes ont été annotés sur le corpus French-UD (Nivre et al., 2016) et le corpus Sequoia (Candito & Seddah, 2012), soit un corpus de 22 645 phrases, pour un total de 4 962 expressions annotées. On obtient un ratio d’une expression annotée tous les 100 tokens environ, avec un fort taux d’expressions discontinues (40%).
Anthology ID:
2017.jeptalnrecital-court.1
Volume:
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
Month:
6
Year:
2017
Address:
Orléans, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
1–9
Language:
French
URL:
https://aclanthology.org/2017.jeptalnrecital-court.1
DOI:
Bibkey:
Cite (ACL):
Marie Candito, Mathieu Constant, Carlos Ramisch, Agata Savary, Yannick Parmentier, Caroline Pasquer, and Jean-Yves Antoine. 2017. Annotation d’expressions polylexicales verbales en français (Annotation of verbal multiword expressions in French). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts, pages 1–9, Orléans, France. ATALA.
Cite (Informal):
Annotation d’expressions polylexicales verbales en français (Annotation of verbal multiword expressions in French) (Candito et al., JEP/TALN/RECITAL 2017)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2017.jeptalnrecital-court.1.pdf