@inproceedings{nishimwe-2023-normalisation,
title = "Normalisation lexicale de contenus g{\'e}n{\'e}r{\'e}s par les utilisateurs sur les r{\'e}seaux sociaux",
author = "Nishimwe, Lydia",
editor = "Candito, Marie and
Gerald, Thomas and
Moreno, Jos{\'e} G",
booktitle = "Actes de CORIA-TALN 2023. Actes des 16e Rencontres Jeunes Chercheurs en RI (RJCRI) et 25e Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL)",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-rjc.11/",
pages = "160--183",
language = "fra",
abstract = "L{'}essor du traitement automatique des langues (TAL) se vit dans un monde o{\`u} l{'}on produit de plus en plus de contenus en ligne. En particulier sur les r{\'e}seaux sociaux, les textes publi{\'e}s par les internautes sont remplis de ph{\'e}nom{\`e}nes {\guillemotleft} non standards {\guillemotright} tels que les fautes d{'}orthographe, l{'}argot, les marques d{'}expressivit{\'e}, etc. Ainsi, les mod{\`e}les de TAL, en grande partie entra{\^i}n{\'e}s sur des donn{\'e}es {\guillemotleft} standards {\guillemotright}, voient leur performance diminuer lorsqu{'}ils sont appliqu{\'e}s aux contenus g{\'e}n{\'e}r{\'e}s par les utilisateurs (CGU). L{'}une des approches pour att{\'e}nuer cette d{\'e}gradation est la normalisation lexicale : les mots non standards sont remplac{\'e}s par leurs formes standards. Dans cet article, nous r{\'e}alisons un {\'e}tat de l{'}art de la normalisation lexicale des CGU, ainsi qu{'}une {\'e}tude exp{\'e}rimentale pr{\'e}liminaire pour montrer les avantages et les difficult{\'e}s de cette t{\^a}che."
}
Markdown (Informal)
[Normalisation lexicale de contenus générés par les utilisateurs sur les réseaux sociaux](https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-rjc.11/) (Nishimwe, JEP/TALN/RECITAL 2023)
ACL