@inproceedings{li-2003-un,
title = "Un syst{\`e}me de segmentation du chinois bas{\'e} sur des triplets",
author = "Li, Yiping",
editor = "Morin, Emmanuel",
booktitle = "Actes de la 10{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters)",
month = jun,
year = "2003",
address = "Batz-sur-Mer, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/moar-dois/2003.jeptalnrecital-recitalposter.6/",
pages = "533--538",
language = "fra",
abstract = "Un des probl{\`e}mes rencontr{\'e}s lors de l{'}analyse de textes en chinois est qu{'}il n{'}existe pas de s{\'e}parateur entr{\'e} l{\'e}s mots dans cette langue. Le mot {\'e}tant une unit{\'e} linguistique fondamentale en traitement automatique d{\'e} la langue, il est n{\'e}cessaire d{'}identifier les mots dans un texte chinois afin que des analys{\'e}s de plus haut niveau puissent {\^e}tre r{\'e}alis{\'e}es. Le but de cet article est d{\'e} pr{\'e}senter un syst{\`e}me d{'}id{\'e}ntification d{\'e}s mots bas{\'e} sur un algorithme utilisant des triplets d{\'e} cat{\'e}gories grammaticales {\'e}t d{\'e}s fr{\'e}quences de mots. C{\'e} syst{\`e}me comprend deux dictionnaires : l{'}un d{\'e}di{\'e} aux mots {\'e}t {\`a} l{\'e}urs fr{\'e}quences, l{'}autr{\'e} aux triplets d{\'e}s cat{\'e}gories correspondantes. Les tests qui ont {\'e}t{\'e} effectu{\'e}s r{\'e}v{\`e}lent que 98,5{\%} d{\'e}s phrases sont d{\'e}coup{\'e}es correctement. Certaines erreurs sont du{\'e}s {\`a} la taill{\'e} limit{\'e}e du dictionnaire utilis{\'e}. Une r{\'e}flexion sur la cr{\'e}ation de nouvelles cat{\'e}gories {\'e}t d{\'e}s {\'e}tudes proposant des r{\`e}gles grammaticales sont en cours de r{\'e}alisation afin d{'}aug1n{\'e}nter la performance du syst{\`e}me."
}
Markdown (Informal)
[Un système de segmentation du chinois basé sur des triplets](https://preview.aclanthology.org/moar-dois/2003.jeptalnrecital-recitalposter.6/) (Li, JEP/TALN/RECITAL 2003)
ACL
- Yiping Li. 2003. Un système de segmentation du chinois basé sur des triplets. In Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (Posters), pages 533–538, Batz-sur-Mer, France. ATALA.