CCL25-Eval任务7系统报告:基于古典汉语理解的双阶段多域微调解析框架

魏祺哲 魏祺哲


Abstract
"古典汉语作为中华传统文化的重要载体,其语言表达高度凝练且语义复杂,给现代大语言模型带来挑战。为提升中文文学语言理解能力,本文提出一种新的解析框架,采用双阶段多域微调训练策略:第一阶段利用指令生成技术获取大量数据集,随后在此数据集上进行稀疏微调,实现基础适应;第二阶段则高质量标注数据上通过冻结参数在不同域精调,提升具体任务表现。实验基于"第一届中国文学语言理解评测(争鸣)"七项任务,此微调框架得到的结果显著优于基线,验证了双阶段多域微调方法的有效性,相关模型已开源于https:/huggingface.co/wqz123/D2Dtest。"
Anthology ID:
2025.ccl-2.31
Volume:
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Month:
August
Year:
2025
Address:
Jinan, China
Editors:
Hongfei Lin, Bin Li, Hongye Tan
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
261–270
Language:
URL:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-2.31/
DOI:
Bibkey:
Cite (ACL):
魏祺哲 魏祺哲. 2025. CCL25-Eval任务7系统报告:基于古典汉语理解的双阶段多域微调解析框架. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 261–270, Jinan, China. Chinese Information Processing Society of China.
Cite (Informal):
CCL25-Eval任务7系统报告:基于古典汉语理解的双阶段多域微调解析框架 (魏祺哲, CCL 2025)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-2.31.pdf