面向法律事件检测的大模型协同主动学习框架

Tingting Cui, Hongying Zan, Xinmeng Ji, Jinwang Song, Kunli Zhang, Yuxiang Jia


Abstract
"法律事件检测任务旨在识别并分类法律文本中的事件。然而,复杂的法律案件使得收集高质量标注数据面临巨大挑战。目前领域数据标注主要依赖人工,成本高昂且耗时。尽管传统的主动学习能够减少部分标注需求,但仍依赖于人工干预。大模型的发展为自动化数据标注带来了可能性,但如何确保标注的可靠性仍是亟待解决的问题。为此,本文提出了创新的协作训练范式,使用主动学习迭代选择训练数据,并利用大模型生成高质量标注,使用评估筛选机制保留高质量标注,大幅减少了人工标注的工作量。在两个事件检测基准数据集上的实验表明,该方法在低资源场景下显著降低了人工标注需求,在部分情况下可以接近监督学习的性能。"
Anthology ID:
2025.ccl-1.4
Volume:
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Month:
August
Year:
2025
Address:
Jinan, China
Editors:
Maosong Sun, Peiyong Duan, Zhiyuan Liu, Ruifeng Xu, Weiwei Sun
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
37–49
Language:
URL:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.4/
DOI:
Bibkey:
Cite (ACL):
Tingting Cui, Hongying Zan, Xinmeng Ji, Jinwang Song, Kunli Zhang, and Yuxiang Jia. 2025. 面向法律事件检测的大模型协同主动学习框架. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 37–49, Jinan, China. Chinese Information Processing Society of China.
Cite (Informal):
面向法律事件检测的大模型协同主动学习框架 (Cui et al., CCL 2025)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.4.pdf