L’architecture d’un modèle hybride pour la normalisation de SMS (A hybrid model architecture for SMS normalization)

Eleni Kogkitsidou, Georges Antoniadis


Abstract
La communication par SMS (Short Message Service), aussi bien que tout autre type de communication virtuelle sous forme de textes courts (mails, microblogs, tweets, etc.), présente certaines particularités spécifiques (syntaxe irrégulière, fusionnement et phonétisation de mots, formes abrégées, etc.). A cause de ces caractéristiques, l’application d’outils en Traitement Automatique du Langage (TAL) rend difficile l’exploitation d’informations utiles contenues dans des messages bruités. Nous proposons un modèle de normalisation en deux étapes fondé sur une approche symbolique et statistique. La première partie vise à produire une représentation intermédiaire du message SMS par l’application des grammaires locales, tandis que la deuxième utilise un système de traduction automatique à base de règles pour convertir la représentation intermédiaire vers une forme standard.
Anthology ID:
2016.jeptalnrecital-poster.6
Volume:
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)
Month:
7
Year:
2016
Address:
Paris, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
AFCP - ATALA
Note:
Pages:
355–363
Language:
French
URL:
https://aclanthology.org/2016.jeptalnrecital-poster.6
DOI:
Bibkey:
Cite (ACL):
Eleni Kogkitsidou and Georges Antoniadis. 2016. L’architecture d’un modèle hybride pour la normalisation de SMS (A hybrid model architecture for SMS normalization). In Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters), pages 355–363, Paris, France. AFCP - ATALA.
Cite (Informal):
L’architecture d’un modèle hybride pour la normalisation de SMS (A hybrid model architecture for SMS normalization) (Kogkitsidou & Antoniadis, JEP/TALN/RECITAL 2016)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2016.jeptalnrecital-poster.6.pdf