基于子词级别词向量和指针网络的朝鲜语句子排序(Korean Sentence Ordering Based on Sub Word Level Word Vector and Pointer Network)

Xiaodong Yan (闫晓东), Xiaoqing Xie (解晓庆)


Abstract
句子排序是多文档摘要系统和机器阅读理解中重要的任务之一,排序的质量将直接 影响摘要和答案的连贯性与可读性。因此,本文采用在中英文上大规模使用的深度 学习方法,同时结合朝鲜语词语形态变化丰富的特点,提出了一种基于子词级别词 向量和指针网络的朝鲜语句子排序模型,其目的是解决传统方法无法挖掘深层语义 信息问题。 本文提出基于形态素拆分的词向量训练方法(MorV),同时对比子词n元 词向量训练方法(SG),得到朝鲜语词向量;采用了两种句向量方法:基于卷积神经网 络(CNN)、基于长短时记忆网络(LSTM),结合指针网络分别进行实验。结果表明本文 采用MorV和LSTM的句向量结合方法可以更好地捕获句子间的语义逻辑关系,提升句 子排序的效果。 关键词: 词向量 ;形态素拆分 ;指针网络 ;句子排序
Anthology ID:
2020.ccl-1.43
Volume:
Proceedings of the 19th Chinese National Conference on Computational Linguistics
Month:
October
Year:
2020
Address:
Haikou, China
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
467–478
Language:
Chinese
URL:
https://aclanthology.org/2020.ccl-1.43
DOI:
Bibkey:
Cite (ACL):
Xiaodong Yan and Xiaoqing Xie. 2020. 基于子词级别词向量和指针网络的朝鲜语句子排序(Korean Sentence Ordering Based on Sub Word Level Word Vector and Pointer Network). In Proceedings of the 19th Chinese National Conference on Computational Linguistics, pages 467–478, Haikou, China. Chinese Information Processing Society of China.
Cite (Informal):
基于子词级别词向量和指针网络的朝鲜语句子排序(Korean Sentence Ordering Based on Sub Word Level Word Vector and Pointer Network) (Yan & Xie, CCL 2020)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2020.ccl-1.43.pdf