@inproceedings{benamar-2020-segmentation,
title = "Segmentation de texte non-supervis{\'e}e pour la d{\'e}tection de th{\'e}matiques {\`a} l{'}aide de plongements lexicaux (Unsupervised text segmentation for topic detection using embeddings )",
author = "Benamar, Alexandra",
editor = "Benzitoun, Christophe and
Braud, Chlo{\'e} and
Huber, Laurine and
Langlois, David and
Ouni, Slim and
Pogodalla, Sylvain and
Schneider, St{\'e}phane",
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). Volume 3 : Rencontre des {\'E}tudiants Chercheurs en Informatique pour le TAL",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-recital.1",
pages = "1--14",
abstract = "Cet article pr{\'e}sente les principales m{\'e}thodes de segmentation automatique de documents textuels sp{\'e}cifiques. La t{\^a}che de segmentation th{\'e}matique de texte consiste {\`a} analyser un document pour en extraire des sections coh{\'e}rentes. Les m{\'e}thodes de segmentation non supervis{\'e}es cherchent {\`a} optimiser une fonction de probabilit{\'e} de segmentation ou une fonction de similarit{\'e} qui peut {\^e}tre calcul{\'e}e entre les blocs ou au sein des blocs. Elles sont r{\'e}parties en trois cat{\'e}gories : les m{\'e}thodes statistiques, les m{\'e}thodes {\`a} base de graphes et les approches neuronales. Parmi les approches neuronales utilis{\'e}es, nous nous int{\'e}ressons tout particuli{\`e}rement {\`a} celles qui utilisent des plongements lexicaux pour repr{\'e}senter des phrases et d{\'e}finir des segments th{\'e}matiques. Tout d{'}abord, nous montrons que les plongements lexicaux permettent une am{\'e}lioration nette des performances par rapport {\`a} des m{\'e}thodes statistiques. Ensuite, nous {\'e}valuons l{'}impact du choix de la repr{\'e}sentation vectorielle des phrases pour cette t{\^a}che de segmentation non supervis{\'e}e.",
language = "French",
}
Markdown (Informal)
[Segmentation de texte non-supervisée pour la détection de thématiques à l’aide de plongements lexicaux (Unsupervised text segmentation for topic detection using embeddings )](https://aclanthology.org/2020.jeptalnrecital-recital.1) (Benamar, JEP/TALN/RECITAL 2020)
ACL