BOLT: Benchmarking Open-World Learning for Text Classification

Chuan Qin; Xi Chen; Jinpeng Li; Hengshu Zhu

BOLT: Benchmarking Open-World Learning for Text Classification

Chuan Qin, Xi Chen, Jinpeng Li, Hengshu Zhu

Abstract

Text classification has long been a cornerstone of NLP, yet most prior work and benchmarks have been limited to closed-world settings, where all classes are assumed to be known in advance. In contrast, open-world learning has recently emerged as a critical paradigm for building more robust and realistic systems. However, existing benchmarks largely focus on out-of-distribution (OOD) detection, while overlooking broader challenges such as the discovery of novel categories. To address this gap, we introduce BOLT, a unified Benchmark and evaluation toolkit supporting Open-world Learning for Text classification. BOLT encompasses two representative tasks: Open-set Text Classification (OSTC), which requires models to classify in-distribution (ID) samples while rejecting OOD inputs, and Generalized Category Discovery (GCD), which aims to identify both known and novel categories from partially labeled corpora. We carefully curate 12 publicly available datasets spanning diverse domains and benchmark 22 methods, including 15 for OSTC and 7 for GCD, under a standardized protocol that explicitly accounts for varying labeled ratios and known class ratios. Our results reveal key challenges: most current methods tend to overfit training distributions and struggle to generalize to unseen classes. Moreover, by comparing our lightweight LLM-based variants with prior open-set baselines, we demonstrate the promise of leveraging LLMs for open-world text classification. BOLT provides standardized evaluation protocols that enable fair comparison and support future research in this emerging area. All datasets, baselines, and tools are available at https://github.com/CNIC-DSL/BOLT.

Anthology ID:: 2026.findings-acl.667
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 13624–13658
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.667/
DOI:
Bibkey:
Cite (ACL):: Chuan Qin, Xi Chen, Jinpeng Li, and Hengshu Zhu. 2026. BOLT: Benchmarking Open-World Learning for Text Classification. In Findings of the Association for Computational Linguistics: ACL 2026, pages 13624–13658, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: BOLT: Benchmarking Open-World Learning for Text Classification (Qin et al., Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.667.pdf
Checklist:: 2026.findings-acl.667.checklist.pdf

PDF Cite Search Checklist Fix data