近十年来澳门的词汇增长(Macau’s Vocabulary Growth in the Recent Ten Year)

Shan Wang (王珊), Zhao Chen (陈钊), Haodi Zhang (张昊迪)


Abstract
词汇增长模型可以通过拟合词种(types)与词例(tokens)之间的数量关系,反映某一领域词汇的历时演化。澳门作为多语言多文化融合之地,词汇的使用情况能够反映社会的关注焦点,但目前尚无对澳门历时词汇演变的研究。本文首次构建澳门汉语历时语料库,利用三大词汇增长模型拟合语料库的词汇变化,并选取效果最好的 Heaps 模型进一步分析词汇演变与报刊内容的关系,结果反映出澳门词汇的变化趋势与热点新闻、澳门施政方针和民生密切相关。本研究还采用去除文本时序信息后的乱序文本,验证了方法的有效性。本文是首项基于大规模历时语料库考察澳门词汇演变的研究,对深入了解澳门语言生活的发展具有重要意义。
Anthology ID:
2021.ccl-1.33
Volume:
Proceedings of the 20th Chinese National Conference on Computational Linguistics
Month:
August
Year:
2021
Address:
Huhhot, China
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
350–360
Language:
Chinese
URL:
https://aclanthology.org/2021.ccl-1.33
DOI:
Bibkey:
Cite (ACL):
Shan Wang, Zhao Chen, and Haodi Zhang. 2021. 近十年来澳门的词汇增长(Macau’s Vocabulary Growth in the Recent Ten Year). In Proceedings of the 20th Chinese National Conference on Computational Linguistics, pages 350–360, Huhhot, China. Chinese Information Processing Society of China.
Cite (Informal):
近十年来澳门的词汇增长(Macau’s Vocabulary Growth in the Recent Ten Year) (Wang et al., CCL 2021)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingestion-script-update/2021.ccl-1.33.pdf