@inproceedings{huang-etal-2025-approche,
title = "Approche m{\'e}thodologique pour la g{\'e}n{\'e}ration de question-r{\'e}ponse portant sur plusieurs documents",
author = "Huang, Hui and
Velcin, Julien and
Kessaci, Yacine",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.3/",
pages = "21--30",
language = "fra",
abstract = "Les syst{\`e}mes de questions-r{\'e}ponses (QA) actuels ont du mal {\`a} synth{\'e}tiser les preuves dispers{\'e}es dans les documents. Alors que les jeux de donn{\'e}es QA scientifiques existants se concentrent sur le raisonnement portant sur un document seul, la t{\^a}che de recherche peut exiger l{'}int{\'e}gration de contenus provenant de plusieurs articles. Pour r{\'e}pondre {\`a} cette limitation, nous proposons un cadre pour cr{\'e}er un jeu de donn{\'e}es QA multi-documents qui s{'}appuie sur l{'}analyse de graphes de citations afin de regrouper des articles connexes et utilise un grand mod{\`e}le de langage (LLM) pour g{\'e}n{\'e}rer des questions complexes. Des exp{\'e}riences pr{\'e}liminaires r{\'e}alis{\'e}es sur 23 882 articles d{\'e}montrent la faisabilit{\'e} de ce cadre, produisant 238 paires QA qui n{\'e}cessitent une synth{\`e}se sur plusieurs articles. D{'}autres exp{\'e}riences indiquent que la recherche d{'}information dense actuelle obtient un rappel limit{\'e} pour ces questions multi-documents, soulignant le besoin de m{\'e}canismes de recherche d{'}information et de raisonnement plus avanc{\'e}s. Il s{'}agit d{'}un projet en cours d'{\'e}laboration. Nous visons {\`a} terme {\`a} fournir un jeu de donn{\'e}es QA robuste qui capture la complexit{\'e} et la nature interconnect{\'e}e des publications scientifiques, ouvrant la voie {\`a} des {\'e}valuations plus r{\'e}alistes des syst{\`e}mes de QA."
}
Markdown (Informal)
[Approche méthodologique pour la génération de question-réponse portant sur plusieurs documents](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.3/) (Huang et al., JEP/TALN/RECITAL 2025)
ACL