From RAG to Reality: Coarse-Grained Hallucination Detection via NLI Fine-Tuning

Daria Galimzianova; Aleksandr Boriskin; Grigory Arshinov

doi:10.18653/v1/2025.sdp-1.34

From RAG to Reality: Coarse-Grained Hallucination Detection via NLI Fine-Tuning

Daria Galimzianova, Aleksandr Boriskin, Grigory Arshinov

Abstract

We present our submission to SciHal Subtask 1: coarse-grained hallucination detection for scientific question answering. We frame hallucination detection as an NLI-style three-way classification (entailment, contradiction, unverifiable) and show that simple fine-tuning of NLI-adapted encoder models on task data outperforms more elaborate feature-based pipelines and large language model prompting. In particular, DeBERTa-V3-large, a model pretrained on five diverse NLI corpora, achieves the highest weighted F1 on the public leaderboard. We additionally explore a pipeline combining joint claim–reference embeddings and NLI softmax probabilities fed into a classifier, but find its performance consistently below direct encoder fine-tuning. Our findings demonstrate that, for reference-grounded hallucination detection, targeted encoder fine-tuning remains the most accurate and efficient approach.

Anthology ID:: 2025.sdp-1.34
Volume:: Proceedings of the Fifth Workshop on Scholarly Document Processing (SDP 2025)
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Tirthankar Ghosal, Philipp Mayr, Amanpreet Singh, Aakanksha Naik, Georg Rehm, Dayne Freitag, Dan Li, Sonja Schimmler, Anita De Waard
Venues:: sdp | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 353–359
Language:
URL:: https://preview.aclanthology.org/ingest-emnlp/2025.sdp-1.34/
DOI:: 10.18653/v1/2025.sdp-1.34
Bibkey:
Cite (ACL):: Daria Galimzianova, Aleksandr Boriskin, and Grigory Arshinov. 2025. From RAG to Reality: Coarse-Grained Hallucination Detection via NLI Fine-Tuning. In Proceedings of the Fifth Workshop on Scholarly Document Processing (SDP 2025), pages 353–359, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: From RAG to Reality: Coarse-Grained Hallucination Detection via NLI Fine-Tuning (Galimzianova et al., sdp 2025)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-emnlp/2025.sdp-1.34.pdf

PDF Cite Search Fix data