R-Bind: Unified Enhancement of Attribute and Relation Binding in Text-to-Image Diffusion Models

Huixuan Zhang; Xiaojun Wan

R-Bind: Unified Enhancement of Attribute and Relation Binding in Text-to-Image Diffusion Models

Abstract

Text-to-image models frequently fail to achieve perfect alignment with textual prompts, particularly in maintaining proper semantic binding between semantic elements in the given prompt. Existing approaches typically require costly retraining or focus on only correctly generating the attributes of entities (entity-attribute binding), ignoring the cruciality of correctly generating the relations between entities (entity-relation-entity binding), resulting in unsatisfactory semantic binding performance. In this work, we propose a novel training-free method R-Bind that simultaneously improves both entity-attribute and entity-relation-entity binding. Our method introduces three inference-time optimization losses that adjust attention maps during generation. Comprehensive evaluations across multiple datasets demonstrate our approach’s effectiveness, validity, and flexibility in enhancing semantic binding without additional training.

Anthology ID:: 2025.emnlp-main.349
Volume:: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing
Month:: November
Year:: 2025
Address:: Suzhou, China
Editors:: Christos Christodoulopoulos, Tanmoy Chakraborty, Carolyn Rose, Violet Peng
Venue:: EMNLP
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 6867–6881
Language:
URL:: https://preview.aclanthology.org/ingest-emnlp/2025.emnlp-main.349/
DOI:
Bibkey:
Cite (ACL):: Huixuan Zhang and Xiaojun Wan. 2025. R-Bind: Unified Enhancement of Attribute and Relation Binding in Text-to-Image Diffusion Models. In Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, pages 6867–6881, Suzhou, China. Association for Computational Linguistics.
Cite (Informal):: R-Bind: Unified Enhancement of Attribute and Relation Binding in Text-to-Image Diffusion Models (Zhang & Wan, EMNLP 2025)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-emnlp/2025.emnlp-main.349.pdf
Checklist:: 2025.emnlp-main.349.checklist.pdf

PDF Cite Search Checklist Fix data