面向工艺规范的树结构检索增强生成方法研究

Yuchen Jiang, Peiyan Wang, Yubo Feng, Zhuo Yu, Guiyang Ji


Abstract
"检 索 增 强 生 成 (Retrieval-Augmented Generation,RAG) 是 一 种 有 效 优 化 大 语 言模 型 在 工 艺 规 范 问 答 任 务 中 性 能 的 方 法 。 然 而 , 基 于 固 定 文 本 长 度 分 块 的 朴素RAG(Naive RAG)在构建工艺规范问答任务时表现不佳。主要原因在于工艺规范是一类复杂的技术文档,采用固定文本长度分块会丢失工艺规范段落层级之间的结构关系以及隐含的知识关联关系,导致输出结果质量下降。因此,本文提出了一种利用工艺规范篇章段落间隐含的树结构关系来构建RAG的方法,该方法有效解决了固定文本长度分块导致的段落之间的知识关联丢失问题。实验结果表明,树结构RAG在评价指标上优于朴素RAG,其中ACC平均提升3.81%,ROUGE-L提升3.28%,BLEU-4提升2.97%,验证了树结构RAG的有效性。"
Anthology ID:
2025.ccl-1.12
Volume:
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Month:
August
Year:
2025
Address:
Jinan, China
Editors:
Maosong Sun, Peiyong Duan, Zhiyuan Liu, Ruifeng Xu, Weiwei Sun
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
143–155
Language:
URL:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.12/
DOI:
Bibkey:
Cite (ACL):
Yuchen Jiang, Peiyan Wang, Yubo Feng, Zhuo Yu, and Guiyang Ji. 2025. 面向工艺规范的树结构检索增强生成方法研究. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 143–155, Jinan, China. Chinese Information Processing Society of China.
Cite (Informal):
面向工艺规范的树结构检索增强生成方法研究 (Jiang et al., CCL 2025)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.12.pdf