基于区域顶点标注的司法文本实体关系联合抽取

Yingying Le, Yuanyuan Sun, Hongfei Lin


Abstract
"司法领域中的实体关系联合抽取在许多下游任务中(如量刑预测、知识库构建等)具有重要意义。然而,由于垂直领域中的数据资源稀缺,而且司法文本中存在复杂的长句以及关系重叠现象,这使得信息抽取工作颇具挑战性。为应对这一挑战,我们首先标注了一个包含多个罪名的司法领域的专有数据集,然后提出了一种基于三元组区域顶点的联合抽取填表法。我们采用多标签分类对三元组的边界进行标注,以此提取三元组,从而充分利用实体的边界信息。此外,为融入实体对之间的距离信息,我们引入了距离嵌入,并采用扩张卷积来捕捉多尺度上下文信息。我们在司法数据集上对模型进行了评估。实验结果表明,我们的模型在这个数据集上均取得了最先进的性能。"
Anthology ID:
2025.ccl-1.6
Volume:
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Month:
August
Year:
2025
Address:
Jinan, China
Editors:
Maosong Sun, Peiyong Duan, Zhiyuan Liu, Ruifeng Xu, Weiwei Sun
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
66–76
Language:
URL:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.6/
DOI:
Bibkey:
Cite (ACL):
Yingying Le, Yuanyuan Sun, and Hongfei Lin. 2025. 基于区域顶点标注的司法文本实体关系联合抽取. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 66–76, Jinan, China. Chinese Information Processing Society of China.
Cite (Informal):
基于区域顶点标注的司法文本实体关系联合抽取 (Le et al., CCL 2025)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.6.pdf