Identity-Robust Language Model Generation via Content Integrity Preservation

Miao Zhang; Kelly Chen; Mehrab Tanjim; Rumi Chunara

Identity-Robust Language Model Generation via Content Integrity Preservation

Miao Zhang, Kelly Chen, Mehrab Tanjim, Rumi Chunara

Abstract

Large Language Model (LLM) outputs often vary across user sociodemographic attributes, leading to disparities in factual accuracy, utility, and safety, even for objective questions where demographic information is irrelevant. Unlike prior work on stereotypical or representational bias, this paper studies identity-dependent degradation of core response quality. We show empirically that such degradation arises from biased generation behavior, despite factual knowledge being robustly encoded across identities. Motivated by this mismatch, we propose a lightweight, training-free framework for identity-robust generation that selectively neutralizes non-critical identity information while preserving semantically essential attributes, thus maintaining output content integrity. Experiments across four benchmarks and 18 sociodemographic identities demonstrate an average 66.3% reduction in identity-dependent bias compared to vanilla prompting and outperforms existing prompt-based defenses. Our work addresses a critical gap in mitigating the impact of user identity cues in prompts on core generation quality.

Anthology ID:: 2026.acl-long.884
Volume:: Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers)
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: ACL
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 19356–19370
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.acl-long.884/
DOI:
Bibkey:
Cite (ACL):: Miao Zhang, Kelly Chen, Mehrab Tanjim, and Rumi Chunara. 2026. Identity-Robust Language Model Generation via Content Integrity Preservation. In Proceedings of the 64th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 19356–19370, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Identity-Robust Language Model Generation via Content Integrity Preservation (Zhang et al., ACL 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.acl-long.884.pdf
Checklist:: 2026.acl-long.884.checklist.pdf

PDF Cite Search Checklist Fix data