UnAC: Adaptive Visual Prompting with Abstraction and Stepwise Checking for Complex Multimodal Reasoning

Yifan Wang; Yun Fu

UnAC: Adaptive Visual Prompting with Abstraction and Stepwise Checking for Complex Multimodal Reasoning

Abstract

Recent large multimodal models (LMMs) have demonstrated impressive capabilities in image understanding, yet they still struggle to perform complex reasoning on challenging multimodal problems. In this paper, we present UnAC (Understanding, Abstracting, and Checking), a multimodal prompting method that strengthens reasoning for complex multimodal tasks in LMMs (e.g., GPT-4o, Gemini 1.5, and GPT-4V). To improve image understanding and capture fine details, we propose an adaptive visual prompting strategy that enables LMMs to focus on salient regions. We further design an image-abstraction prompt to effectively extract key information from images. In addition, we introduce a gradual self-checking scheme that improves reasoning by verifying each decomposed subquestion and its answer. Extensive experiments on three public benchmarks—MathVista, MM-Vet, and MMMU—demonstrate the effectiveness of our method.

Anthology ID:: 2026.findings-acl.1196
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 23884–23893
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.1196/
DOI:
Bibkey:
Cite (ACL):: Yifan Wang and Yun Fu. 2026. UnAC: Adaptive Visual Prompting with Abstraction and Stepwise Checking for Complex Multimodal Reasoning. In Findings of the Association for Computational Linguistics: ACL 2026, pages 23884–23893, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: UnAC: Adaptive Visual Prompting with Abstraction and Stepwise Checking for Complex Multimodal Reasoning (Wang & Fu, Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.1196.pdf
Checklist:: 2026.findings-acl.1196.checklist.pdf

PDF Cite Search Checklist Fix data