Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts)

Louise Tarrade, Cédric Lopez, Rachel Panckhurst, Geroges Antoniadis


Abstract
La tâche de normalisation automatique des messages issus de la communication électronique médiée requiert une étape préalable consistant à identifier les phénomènes linguistiques. Dans cet article, nous proposons deux typologies pour l’annotation de textes non standard en français, relevant respectivement des niveaux morpho-lexical et morpho-syntaxique. Ces typologies ont été développées en conciliant les typologies existantes et en les faisant évoluer en parallèle d’une annotation manuelle de tweets et de SMS.
Anthology ID:
2017.jeptalnrecital-court.15
Volume:
Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
Month:
6
Year:
2017
Address:
Orléans, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
118–125
Language:
French
URL:
https://aclanthology.org/2017.jeptalnrecital-court.15
DOI:
Bibkey:
Cite (ACL):
Louise Tarrade, Cédric Lopez, Rachel Panckhurst, and Geroges Antoniadis. 2017. Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts, pages 118–125, Orléans, France. ATALA.
Cite (Informal):
Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts) (Tarrade et al., JEP/TALN/RECITAL 2017)
Copy Citation:
PDF:
https://preview.aclanthology.org/auto-file-uploads/2017.jeptalnrecital-court.15.pdf