@inproceedings{jiang-ying-2025-deepseekdeng,
title = "{D}eep{S}eek等大语言模型幽默生成能力及其特征的评测分析",
author = "Jiang, Yanting and
Ying, Yizhou",
editor = "Sun, Maosong and
Duan, Peiyong and
Liu, Zhiyuan and
Xu, Ruifeng and
Sun, Weiwei",
booktitle = "Proceedings of the 24th {C}hina National Conference on Computational Linguistics ({CCL} 2025)",
month = aug,
year = "2025",
address = "Jinan, China",
publisher = "Chinese Information Processing Society of China",
url = "https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.3/",
pages = "28--36",
abstract = "``以人类的笑话文本为基础,比较评测了4个大语言模型生成幽默笑点句的能力。总的来看,目前DeepSeek-R1的中文幽默生成能力强于GPT-4o、Qwen2.5-7B和Qwen3模型 , 但 距 离 人 类 的 幽 默 能 力 还 有 明 显 的 差 距 。 各 模 型 基 于 固 定 表 达 生 成 笑 点 句时,或多或少存在{``}思维定势{''}问题。测查了人类与大语言模型幽默文本的9项语言特征。DeepSeek与人类的相似笑点最多,BLEU-4匹配度也最高。与人类相比,AI生成的笑点句更倾向于使用高频常见的词,未登录词、网络新词的比例更低,在长度上普遍更长。基于Sentence-BERT模型获取语义表示,大模型的笑点句在语义联想距离上普遍比人类的笑点句更短。强化谐音双关、语义双关等修辞手法的运用,是大模型提高幽默文本生成能力的重要途径。最后,我们讨论了本文评价方式的优劣,并展望了增强大模型幽默能力的3个策略:优化提示工程、构建幽默多模态大模型、在推理中增强幽默文本的可解释。''"
}Markdown (Informal)
[DeepSeek等大语言模型幽默生成能力及其特征的评测分析](https://preview.aclanthology.org/ingest-ccl/2025.ccl-1.3/) (Jiang & Ying, CCL 2025)
ACL
- Yanting Jiang and Yizhou Ying. 2025. DeepSeek等大语言模型幽默生成能力及其特征的评测分析. In Proceedings of the 24th China National Conference on Computational Linguistics (CCL 2025), pages 28–36, Jinan, China. Chinese Information Processing Society of China.