@inproceedings{keraghel-nadif-2025-graphes,
title = "Graphes, {NER} et {LLM}s pour la classification non supervis{\'e}e de documents",
author = "Keraghel, Imed and
Nadif, Mohamed",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publi{\'e}s",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-trad.15/",
pages = "31--31",
language = "fra",
abstract = "Les r{\'e}cents progr{\`e}s en apprentissage automatique, notamment les mod{\`e}les de langage de grande taille (LLMs) tels que BERT et GPT, offrent des plongements contextuels riches qui am{\'e}liorent la repr{\'e}sentation des textes. Cependant, les approches actuelles de clustering de documents n{\'e}gligent souvent les relations profondes entre entit{\'e}s nomm{\'e}es ainsi que le potentiel des repr{\'e}sentations issues des LLMs. Cet article propose une nouvelle approche qui int{\`e}gre la reconnaissance d{'}entit{\'e}s nomm{\'e}es (NER) et les embeddings de LLMs dans un cadre fond{\'e} sur les graphes pour le clustering de documents. La m{\'e}thode construit un graphe dont les n{\oe}uds repr{\'e}sentent les documents et dont les ar{\^e}tes sont pond{\'e}r{\'e}es par la similarit{\'e} entre entit{\'e}s nomm{\'e}es, le tout optimis{\'e} au moyen d{'}un r{\'e}seau de neurones convolutifs sur graphes (GCN). Cela permet un regroupement plus efficace des documents s{\'e}mantiquement proches. Les r{\'e}sultats exp{\'e}rimentaux indiquent que notre approche surpasse les m{\'e}thodes traditionnelles bas{\'e}es sur la cooccurrence, en particulier pour les documents riches en entit{\'e}s nomm{\'e}es."
}
Markdown (Informal)
[Graphes, NER et LLMs pour la classification non supervisée de documents](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-trad.15/) (Keraghel & Nadif, JEP/TALN/RECITAL 2025)
ACL