PISCO: Pretty Simple Compression for Retrieval-Augmented Generation

Maxime Louis; Hervé Déjean; Stéphane Clinchant

PISCO: Pretty Simple Compression for Retrieval-Augmented Generation

Maxime Louis, Hervé Déjean, Stéphane Clinchant

Abstract

Retrieval-Augmented Generation (RAG) pipelines enhance Large Language Models (LLMs) by retrieving relevant documents, but they face scalability issues due to high inference costs and limited context size. Document compression is a practical solution, but current soft compression methods often suffer from accuracy losses and require extensive pretraining. In this paper, we introduce PISCO, a novel method that achieves a 16x compression rate with minimal accuracy loss (0-3%) across diverse RAG-based question-answering (QA) tasks. Unlike existing approaches, PISCO requires no pretraining or annotated data, relying solely on sequence-level knowledge distillation from document-based questions. With the ability to fine-tune a 7-10B LLM in 24 hours on a single A100 GPU, PISCO offers a highly efficient and scalable solution. We present comprehensive experiments showing that PISCO outperforms existing compression models by 8% in accuracy.

Anthology ID:: 2025.findings-acl.800
Volume:: Findings of the Association for Computational Linguistics: ACL 2025
Month:: July
Year:: 2025
Address:: Vienna, Austria
Editors:: Wanxiang Che, Joyce Nabende, Ekaterina Shutova, Mohammad Taher Pilehvar
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 15506–15521
Language:
URL:: https://preview.aclanthology.org/landing_page/2025.findings-acl.800/
DOI:
Bibkey:
Cite (ACL):: Maxime Louis, Hervé Déjean, and Stéphane Clinchant. 2025. PISCO: Pretty Simple Compression for Retrieval-Augmented Generation. In Findings of the Association for Computational Linguistics: ACL 2025, pages 15506–15521, Vienna, Austria. Association for Computational Linguistics.
Cite (Informal):: PISCO: Pretty Simple Compression for Retrieval-Augmented Generation (Louis et al., Findings 2025)
Copy Citation:
PDF:: https://preview.aclanthology.org/landing_page/2025.findings-acl.800.pdf

PDF Cite Search Fix data