@inproceedings{bigi-smaili-2002-identification,
title = "Identification th{\'e}matique hi{\'e}rarchique : Application aux forums de discussions",
author = {Bigi, Brigitte and
Sma{\"i}li, Kamel},
editor = "Pierrel, Jean-Marie",
booktitle = "Actes de la 9{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2002",
address = "Nancy, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2002.jeptalnrecital-long.9/",
pages = "116--125",
language = "fra",
abstract = "Les mod{\`e}les statistiques du langage ont pour but de donner une repr{\'e}sentation statistique de la langue mais souffrent de nombreuses imperfections. Des travaux r{\'e}cents ont montr{\'e} que ces mod{\`e}les peuvent {\^e}tre am{\'e}lior{\'e}s s{'}ils peuvent b{\'e}n{\'e}ficier de la connaissance du th{\`e}me trait{\'e}, afin de s{'}y adapter. Le th{\`e}me du document est alors obtenu par un m{\'e}canisme d{'}identification th{\'e}matique, mais les th{\`e}mes ainsi trait{\'e}s sont souvent de granularit{\'e} diff{\'e}rente, c{'}est pourquoi il nous semble opportun qu{'}ils soient organis{\'e}s dans une hi{\'e}rarchie. Cette structuration des th{\`e}mes implique la mise en place de techniques sp{\'e}cifiques d{'}identification th{\'e}matique. Cet article propose un mod{\`e}le statistique {\`a} base d{'}unigrammes pour identifier automatiquement le th{\`e}me d{'}un document parmi une arborescence pr{\'e}d{\'e}finie de th{\`e}mes possibles. Nous pr{\'e}sentons {\'e}galement un crit{\`e}re qui permet au mod{\`e}le de donner un degr{\'e} de fiabilit{\'e} {\`a} la d{\'e}cision prise. L{'}ensemble des exp{\'e}rimentations a {\'e}t{\'e} r{\'e}alis{\'e} sur des donn{\'e}es extraites du groupe `fr' des forums de discussion."
}
Markdown (Informal)
[Identification thématique hiérarchique : Application aux forums de discussions](https://preview.aclanthology.org/fix-sig-urls/2002.jeptalnrecital-long.9/) (Bigi & Smaïli, JEP/TALN/RECITAL 2002)
ACL