MonCulture-Eval: A Hierarchical Benchmark for Evaluating Mongolian Cultural Capabilities of Large Language Models across Scripts and Regions

Quulgan Minggad; Xiao Zinan; Yuan Sun

MonCulture-Eval: A Hierarchical Benchmark for Evaluating Mongolian Cultural Capabilities of Large Language Models across Scripts and Regions

Abstract

While Large Language Models (LLMs) have achieved impressive linguistic fluency in low-resource languages, their capacity to process deep cultural nuances remains insufficiently quantified. This paper introduces MonCulture-Eval, a benchmark designed to assess the cultural intelligence of LLMs in the Mongolian context across two writing systems (Traditional and Cyrillic) and three regional sub-cultures (Alxa, Ordos, and Horqin). Curated entirely from primary, non-digitized archives to prevent data contamination, the benchmark employs a three-layer cognitive hierarchy—Factual, Situational, and Values—supplemented by specialized tasks including Riddles, Taboos, and Proverbs. Evaluation of frontier models reveals a severe "Script Gap" and a systematic "Etic Bias," where models sanitize spiritual rituals into secular functional norms.

Anthology ID:: 2026.findings-acl.1449
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 28997–29014
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.1449/
DOI:
Bibkey:
Cite (ACL):: Quulgan Minggad, Xiao Zinan, and Yuan Sun. 2026. MonCulture-Eval: A Hierarchical Benchmark for Evaluating Mongolian Cultural Capabilities of Large Language Models across Scripts and Regions. In Findings of the Association for Computational Linguistics: ACL 2026, pages 28997–29014, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: MonCulture-Eval: A Hierarchical Benchmark for Evaluating Mongolian Cultural Capabilities of Large Language Models across Scripts and Regions (Minggad et al., Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.1449.pdf
Checklist:: 2026.findings-acl.1449.checklist.pdf

PDF Cite Search Checklist Fix data