@inproceedings{vaillant-etal-2006-analyse,
title = "Analyse spectrale des textes : d{\'e}tection automatique des fronti{\`e}res de langue et de discours",
author = "Vaillant, Pascal and
Nock, Richard and
Henry, Claudia",
editor = "Mertens, Piet and
Fairon, C{\'e}drick and
Dister, Anne and
Watrin, Patrick",
booktitle = "Actes de la 13{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = apr,
year = "2006",
address = "Leuven, Belgique",
publisher = "ATALA",
url = "https://preview.aclanthology.org/jlcl-multiple-ingestion/2006.jeptalnrecital-poster.26/",
pages = "619--629",
language = "fra",
abstract = "Nous proposons un cadre th{\'e}orique qui permet, {\`a} partir de matrices construites sur la base des donn{\'e}es statistiques d`un corpus, d`extraire par des proc{\'e}d{\'e}s math{\'e}matiques simples des informations sur les mots du vocabulaire de ce corpus, et sur la syntaxe des langues qui l`ont engendr{\'e}. {\`A} partir des m{\^e}mes donn{\'e}es initiales, on peut construire une matrice de similarit{\'e} syntagmatique (probabilit{\'e}s de transition d`un mot {\`a} un autre), ou une matrice de similarit{\'e} paradigmatique (probabilit{\'e} de partager des contextes identiques). Pour ce qui concerne la premi{\`e}re de ces deux possibilit{\'e}s, les r{\'e}sultats obtenus sont interpr{\'e}t{\'e}s dans le cadre d`une mod{\'e}lisation du processus g{\'e}n{\'e}ratif par cha{\^i}nes de Markov. Nous montrons que les r{\'e}sultats d`une analyse spectrale de la matrice de transition peuvent {\^e}tre interpr{\'e}t{\'e}s comme des probabilit{\'e}s d`appartenance de mots {\`a} des classes. Cette m{\'e}thode nous permet d`obtenir une classification continue des mots du vocabulaire dans des sous-syst{\`e}mes g{\'e}n{\'e}ratifs contribuant {\`a} la g{\'e}n{\'e}ration de textes composites. Une application pratique est la segmentation de textes h{\'e}t{\'e}rog{\`e}nes en segments homog{\`e}nes d`un point de vue linguistique, notamment dans le cas de langues proches par le degr{\'e} de recouvrement de leurs vocabulaires."
}
Markdown (Informal)
[Analyse spectrale des textes : détection automatique des frontières de langue et de discours](https://preview.aclanthology.org/jlcl-multiple-ingestion/2006.jeptalnrecital-poster.26/) (Vaillant et al., JEP/TALN/RECITAL 2006)
ACL