@inproceedings{adjali-etal-2025-generation,
    title = "G{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration multi-niveau pour r{\'e}pondre {\`a} des questions visuelles",
    author = "Adjali, Omar  and
      Ferret, Olivier  and
      Ghannay, Sahar  and
      Le Borgne, Herv{\'e}",
    editor = "Bechet, Fr{\'e}d{\'e}ric  and
      Chifu, Adrian-Gabriel  and
      Pinel-sauvagnat, Karen  and
      Favre, Benoit  and
      Maes, Eliot  and
      Nurbakova, Diana",
    booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
    month = "6",
    year = "2025",
    address = "Marseille, France",
    publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
    url = "https://preview.aclanthology.org/ingest-emnlp/2025.jeptalnrecital-coria.11/",
    pages = "128--130",
    language = "fra",
    abstract = {La t{\^a}che de r{\'e}ponse {\`a} des questions visuelles {\`a} propos d{'}entit{\'e}s nomm{\'e}es, qui s{'}appuie sur la d{\'e}sambigu{\"i}sation des entit{\'e}s {\`a} l{'}aide d{'}informations textuelles et visuelles ainsi que de connaissances, se d{\'e}compose principalement en deux {\'e}tapes : recherche d{'}information puis recherche des r{\'e}ponses, souvent abord{\'e}es ind{\'e}pendamment l{'}une de l{'}autre. La g{\'e}n{\'e}ration augment{\'e}e de r{\'e}cup{\'e}ration (RAG) offre une solution {\`a} ce manque d{'}interaction en utilisant les r{\'e}ponses g{\'e}n{\'e}r{\'e}es comme signal pour l{'}entra{\^i}nement de la recherche d{'}information. Le RAG s{'}appuie g{\'e}n{\'e}ralement sur des passages pseudo-pertinents extraits de bases de connaissances externes, ce qui peut conduire {\`a} des erreurs au niveau de la g{\'e}n{\'e}ration de r{\'e}ponses. Dans ce travail, nous proposons une approche de RAG {\`a} plusieurs niveaux am{\'e}liorant la g{\'e}n{\'e}ration de r{\'e}ponses en associant recherche d{'}entit{\'e}s et expansion de requ{\^e}te. Plus pr{\'e}cis{\'e}ment, nous d{\'e}finissons une fonction de perte RAG permettant de conditionner la g{\'e}n{\'e}ration de r{\'e}ponses {\`a} la fois par la recherche d{'}entit{\'e}s et celle de passages. Cette approche permet de d{\'e}passer les travaux existants sur le jeu d'{\'e}valuation ViQuAE, d{\'e}montrant ainsi que les connaissances qu{'}elle va chercher sont plus pertinentes pour la g{\'e}n{\'e}ration de r{\'e}ponses.}
}Markdown (Informal)
[Génération augmentée de récupération multi-niveau pour répondre à des questions visuelles](https://preview.aclanthology.org/ingest-emnlp/2025.jeptalnrecital-coria.11/) (Adjali et al., JEP/TALN/RECITAL 2025)
ACL