Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts)
Louise Tarrade, Cédric Lopez, Rachel Panckhurst, Geroges Antoniadis
Abstract
La tâche de normalisation automatique des messages issus de la communication électronique médiée requiert une étape préalable consistant à identifier les phénomènes linguistiques. Dans cet article, nous proposons deux typologies pour l’annotation de textes non standard en français, relevant respectivement des niveaux morpho-lexical et morpho-syntaxique. Ces typologies ont été développées en conciliant les typologies existantes et en les faisant évoluer en parallèle d’une annotation manuelle de tweets et de SMS.- Anthology ID:
- 2017.jeptalnrecital-court.15
- Volume:
- Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
- Month:
- 6
- Year:
- 2017
- Address:
- Orléans, France
- Venue:
- JEP/TALN/RECITAL
- SIG:
- Publisher:
- ATALA
- Note:
- Pages:
- 118–125
- Language:
- French
- URL:
- https://aclanthology.org/2017.jeptalnrecital-court.15
- DOI:
- Cite (ACL):
- Louise Tarrade, Cédric Lopez, Rachel Panckhurst, and Geroges Antoniadis. 2017. Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts). In Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts, pages 118–125, Orléans, France. ATALA.
- Cite (Informal):
- Typologies pour l’annotation de textes non standard en français (Typologies for the annotation of non-standard French texts) (Tarrade et al., JEP/TALN/RECITAL 2017)
- PDF:
- https://preview.aclanthology.org/ingestion-script-update/2017.jeptalnrecital-court.15.pdf