DeepSeek等大语言模型幽默生成能力及其特征的评测分析

Yanting Jiang, Yizhou Ying


Abstract
"以人类的笑话文本为基础,比较评测了4个大语言模型生成幽默笑点句的能力。总的来看,目前DeepSeek-R1的中文幽默生成能力强于GPT-4o、Qwen2.5-7B和Qwen3模型 , 但 距 离 人 类 的 幽 默 能 力 还 有 明 显 的 差 距 。 各 模 型 基 于 固 定 表 达 生 成 笑 点 句时,或多或少存在“思维定势”问题。测查了人类与大语言模型幽默文本的9项语言特征。DeepSeek与人类的相似笑点最多,BLEU-4匹配度也最高。与人类相比,AI生成的笑点句更倾向于使用高频常见的词,未登录词、网络新词的比例更低,在长度上普遍更长。基于Sentence-BERT模型获取语义表示,大模型的笑点句在语义联想距离上普遍比人类的笑点句更短。强化谐音双关、语义双关等修辞手法的运用,是大模型提高幽默文本生成能力的重要途径。最后,我们讨论了本文评价方式的优劣,并展望了增强大模型幽默能力的3个策略:优化提示工程、构建幽默多模态大模型、在推理中增强幽默文本的可解释。"
Anthology ID:
2025.ccl-1.3
Volume:
Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025)
Month:
August
Year:
2025
Address:
Jinan, China
Editors:
Maosong Sun, Peiyong Duan, Zhiyuan Liu, Ruifeng Xu, Weiwei Sun
Venue:
CCL
SIG:
Publisher:
Chinese Information Processing Society of China
Note:
Pages:
28–36
Language:
URL:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.3/
DOI:
Bibkey:
Cite (ACL):
Yanting Jiang and Yizhou Ying. 2025. DeepSeek等大语言模型幽默生成能力及其特征的评测分析. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 28–36, Jinan, China. Chinese Information Processing Society of China.
Cite (Informal):
DeepSeek等大语言模型幽默生成能力及其特征的评测分析 (Jiang & Ying, CCL 2025)
Copy Citation:
PDF:
https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.3.pdf