@inproceedings{boualili-etal-2023-highlighting,
title = "Highlighting exact matching via marking strategies for ad hoc document ranking with pretrained contextualized language models",
author = "Boualili, Lila and
Moreno, Jose and
Boughanem, Mohand",
editor = {Zargayouna, Ha{\"i}fa},
booktitle = "Actes de CORIA-TALN 2023. Actes de la 18e Conf{\'e}rence en Recherche d'Information et Applications (CORIA)",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-coria.14/",
pages = "201--201",
abstract = "Les mod{\`e}les de langue pr{\'e}-entra{\^i}n{\'e}s (MLPs) {\`a} l{'}instar de BERT se sont r{\'e}v{\'e}l{\'e}s remarquablement efficaces pour le classement ad hoc. Contrairement aux mod{\`e}les ant{\'e}rieurs {\`a} BERT qui n{\'e}cessitent des composants neuronaux sp{\'e}cialis{\'e}s pour capturer les diff{\'e}rents aspects de la pertinence entre la requ{\^e}te et le document, les MLPs sont uniquement bas{\'e}s sur des blocs de ``transformers'' o{\`u} l{'}attention est le seul m{\'e}canisme utilis{\'e} pour extraire des signaux {\`a} partir des interactions entre les termes de la requ{\^e}te et le document. Gr{\^a}ce {\`a} l{'}attention crois{\'e}e du ``transformer'', BERT s{'}est av{\'e}r{\'e} {\^e}tre un mod{\`e}le d{'}appariement s{\'e}mantique efficace. Cependant, l{'}appariement exact reste un signal essentiel pour {\'e}valuer la pertinence d{'}un document par rapport {\`a} une requ{\^e}te de recherche d{'}informations, en dehors de l{'}appariement s{\'e}mantique. Dans cet article, nous partons de l{'}hypoth{\`e}se que BERT pourrait b{\'e}n{\'e}ficier d{'}indices explicites d{'}appariement exact pour mieux s{'}adapter {\`a} la t{\^a}che d{'}estimation de pertinence. Dans ce travail, nous explorons des strat{\'e}gies d{'}int{\'e}gration des signaux d{'}appariement exact en utilisant des ``tokens'' de marquage permettant de mettre en {\'e}vidence les correspondances exactes entre les termes de la requ{\^e}te et ceux du document. Nous constatons que cette approche de marquage simple am{\'e}liore de mani{\`e}re significative le mod{\`e}le BERT vanille de r{\'e}f{\'e}rence. Nous d{\'e}montrons empiriquement l{'}efficacit{\'e} de notre approche par le biais d{'}exp{\'e}riences exhaustives sur trois collections standards en recherche d{'}information (RI). Les r{\'e}sultats montrent que les indices explicites de correspondance exacte transmis par le marquage sont b{\'e}n{\'e}fiques pour des MLPs aussi bien BERT que pour ELECTRA. Nos r{\'e}sultats confirment que les indices traditionnels de RI, tels que la correspondance exacte de termes, sont toujours utiles pour les nouveaux mod{\`e}les contextualis{\'e}s pr{\'e}-entra{\^i}n{\'e}s tels que BERT."
}
Markdown (Informal)
[Highlighting exact matching via marking strategies for ad hoc document ranking with pretrained contextualized language models](https://preview.aclanthology.org/fix-sig-urls/2023.jeptalnrecital-coria.14/) (Boualili et al., JEP/TALN/RECITAL 2023)
ACL