@inproceedings{adjali-etal-2025-generation,
title = "G{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration multi-niveau pour r{\'e}pondre {\`a} des questions visuelles",
author = "Adjali, Omar and
Ferret, Olivier and
Ghannay, Sahar and
Le Borgne, Herv{\'e}",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.11/",
pages = "128--130",
language = "fra",
abstract = {La t{\^a}che de r{\'e}ponse {\`a} des questions visuelles {\`a} propos d{'}entit{\'e}s nomm{\'e}es, qui s{'}appuie sur la d{\'e}sambigu{\"i}sation des entit{\'e}s {\`a} l{'}aide d{'}informations textuelles et visuelles ainsi que de connaissances, se d{\'e}compose principalement en deux {\'e}tapes : recherche d{'}information puis recherche des r{\'e}ponses, souvent abord{\'e}es ind{\'e}pendamment l{'}une de l{'}autre. La g{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration (RAG) offre une solution {\`a} ce manque d{'}interaction en utilisant les r{\'e}ponses g{\'e}n{\'e}r{\'e}es comme signal pour l{'}entra{\^i}nement de la recherche d{'}information. Le RAG s{'}appuie g{\'e}n{\'e}ralement sur des passages pseudo-pertinents extraits de bases de connaissances externes, ce qui peut conduire {\`a} des erreurs au niveau de la g{\'e}n{\'e}ration de r{\'e}ponses. Dans ce travail, nous proposons une approche de RAG {\`a} plusieurs niveaux am{\'e}liorant la g{\'e}n{\'e}ration de r{\'e}ponses en associant recherche d{'}entit{\'e}s et expansion de requ{\^e}te. Plus pr{\'e}cis{\'e}ment, nous d{\'e}finissons une fonction de perte RAG permettant de conditionner la g{\'e}n{\'e}ration de r{\'e}ponses {\`a} la fois par la recherche d{'}entit{\'e}s et celle de passages. Cette approche permet de d{\'e}passer les travaux existants sur le jeu d'{\'e}valuation ViQuAE, d{\'e}montrant ainsi que les connaissances qu{'}elle va chercher sont plus pertinentes pour la g{\'e}n{\'e}ration de r{\'e}ponses.}
}
Markdown (Informal)
[Génération augmentée de récupération multi-niveau pour répondre à des questions visuelles](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.11/) (Adjali et al., JEP/TALN/RECITAL 2025)
ACL