@inproceedings{zong-piwowarski-2025-vers,
title = "Vers un {\'e}lagage de tokens sans co{\^u}t dans les mod{\`e}les de r{\'e}cup{\'e}ration {\`a} interaction tardive",
author = "Zong, Yuxuan and
Piwowarski, Benjamin",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.25/",
pages = "294--309",
language = "fra",
abstract = "Les mod{\`e}les de RI neuronaux {\`a} interaction tardive comme ColBERT offrent un compromis comp{\'e}titif entre efficacit{\'e} et efficience sur de nombreuses bases de r{\'e}f{\'e}rence. Cependant, ils n{\'e}cessitent un espace m{\'e}moire consid{\'e}rable pour stocker les repr{\'e}sentations contextuelles de tous les tokens des documents. Certains travaux ont propos{\'e} d{'}utiliser soit des heuristiques, soit des techniques bas{\'e}es sur les statistiques pour {\'e}laguer des tokens dans chaque document. Cependant, cela ne garantit pas que les tokens supprim{\'e}s n{'}aient aucun impact sur le score de r{\'e}cup{\'e}ration. Notre travail utilise une approche m{\'e}thodique pour d{\'e}finir comment {\'e}laguer des tokens sans affecter le score entre un document et une question. Nous introduisons trois co{\^u}ts de r{\'e}gularisation, qui induisent une solution avec des taux d'{\'e}lagage {\'e}lev{\'e}s, ainsi que deux strat{\'e}gies d'{\'e}lagage. Nous les {\'e}tudions exp{\'e}rimentalement (en domaine interne et externe), d{\'e}montrant que nous pouvons pr{\'e}server les performances de ColBERT tout en n{'}utilisant que 30{\%} des tokens."
}
Markdown (Informal)
[Vers un élagage de tokens sans coût dans les modèles de récupération à interaction tardive](https://preview.aclanthology.org/corrections-2025-10/2025.jeptalnrecital-coria.25/) (Zong & Piwowarski, JEP/TALN/RECITAL 2025)
ACL