Yanlu Xie


2022

pdf
基于GPT-2和互信息的语言单位信息量对韵律特征的影响(Prosodic Effects of Speech Unit’s Information Based on GPT-2 and Mutual Information)
Yun Hao (郝韵) | Yanlu Xie (解焱陆) | Binghuai Lin (林炳怀) | Jinsong Zhang (张劲松)
Proceedings of the 21st Chinese National Conference on Computational Linguistics

“基于信息论的言语产出研究发现携带信息量越大的语言单位,其语音信号越容易被强化。目前的相关研究主要通过自信息的方式衡量语言单位信息量,但该方法难以对长距离的上下文语境进行建模。本研究引入基于预训练语言模型GPT-2和文本-拼音互信息的语言单位信息量衡量方式,考察汉语的单词、韵母和声调信息量对语音产出的韵律特征的影响。研究结果显示汉语中单词和韵母信息量更大时,其韵律特征倾向于被增强,证明了我们提出的方法是有效的。其中信息量效应在音长特征上相比音高和音强特征更显著。”

2020

pdf
发音属性优化建模及其在偏误检测的应用(Speech attributes optimization modeling and application in mispronunciation detection)
Minghao Guo (郭铭昊) | Yanlu Xie (解焱陆)
Proceedings of the 19th Chinese National Conference on Computational Linguistics

近年来,发音属性常常被用于计算机辅助发音训练系统(CAPT)中。本文针对使用发音属性的一些难点,提出了一种建模细颗粒度发音属性(FSA)的方法,并在跨语言属性识别、发音偏误检测中进行测试。最终,我们得到了最优平均识别准确率约为95%的属性检测器组;在两个二语测试集上的偏误检测,相比基线,基于FSA方法均获得了超过1%的性能提升。此外,我们还根据发音属性的跨语言特性设置了对照实验,并在上述任务中测试和分析。