机器音译研究综述(Survey on Machine Transliteration)

Zhuo Li (李卓), Zhijuan Wang (王志娟), Xiaobing Zhao (赵小兵)


Abstract
“机器音译是基于语音相似性自动将文本从一种语言转换为另一种语言的过程,它是机器翻译的一个子任务,侧重于语音信息的翻译。音译后可知道源单词在另一种语言中的发音,使不熟悉源语言的人更容易理解该语言,有益于消除语言和拼写障碍。机器音译在多语言文本处理、语料库对齐、信息抽取等自然语言应用中发挥着重要作用。本文阐述了目前机器音译任务中存在的挑战,对主要的音译方法进行了剖析、分类和整理,对音译数据集进行了罗列汇总,并列出了常用的音译效果评价指标,最后对该领域目前存在的问题进行了说明并对音译学的未来进行了展望。本文以期对进入该领域的新人提供快速的入门指南,或供其他研究者参考。”
Anthology ID:
2022.ccl-1.29
Volume:
Proceedings of the 21st Chinese National Conference on Computational Linguistics
Month:
October
Year:
2022
Address:
Nanchang, China
Editors:
Maosong Sun (孙茂松), Yang Liu (刘洋), Wanxiang Che (车万翔), Yang Feng (冯洋), Xipeng Qiu (邱锡鹏), Gaoqi Rao (饶高琦), Yubo Chen (陈玉博)
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
317–332
Language:
Chinese
URL:
https://aclanthology.org/2022.ccl-1.29
DOI:
Bibkey:
Cite (ACL):
Zhuo Li, Zhijuan Wang, and Xiaobing Zhao. 2022. 机器音译研究综述(Survey on Machine Transliteration). In Proceedings of the 21st Chinese National Conference on Computational Linguistics, pages 317–332, Nanchang, China. Chinese Information Processing Society of China.
Cite (Informal):
机器音译研究综述(Survey on Machine Transliteration) (Li et al., CCL 2022)
Copy Citation:
PDF:
https://preview.aclanthology.org/emnlp-22-attachments/2022.ccl-1.29.pdf
Data
ANETAC