SEC-FinTables: Evaluating Large Language Models for Detecting Logical Inconsistencies on Tabular Data

Shuyan Ke; Qiong Wu; Hui Li; Liujuan Cao

SEC-FinTables: Evaluating Large Language Models for Detecting Logical Inconsistencies on Tabular Data

Shuyan Ke, Qiong Wu, Hui Li, Liujuan Cao

Abstract

Large language models (LLMs) are increasingly deployed in high-stakes domains reliant on tabular data (e.g., financial reporting), where undetected logical inconsistencies such as mismatched totals and components can lead to critical errors. Yet, the ability of LLMs to identify such inconsistencies remains poorly understood, hindered by the absence of standardized evaluation frameworks and cell-level annotated datasets. To bridge this gap, we propose a comprehensive benchmark SEC-Fintables comprising 103,395 real-world and error-injected table instances, alongside a novel evaluation protocol that decomposes inconsistency detection into granular sub-tasks. Through evaluating both proprietary and open-source LLMs on SEC-Fintables, we find that contemporary LLMs exhibit only partial competence in detecting logical inconsistencies. Our study reveals key limitations and improvement opportunities for LLMs. We believe SEC-Fintables and our evaluation protocol can serve as a practical resource for advancing reliable inconsistency detection of LLMs in tabular reasoning. We release SEC-Fintables at https://github.com/XIEFOX/SEC-Fintables.

Anthology ID:: 2026.findings-acl.764
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 15587–15607
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.764/
DOI:
Bibkey:
Cite (ACL):: Shuyan Ke, Qiong Wu, Hui Li, and Liujuan Cao. 2026. SEC-FinTables: Evaluating Large Language Models for Detecting Logical Inconsistencies on Tabular Data. In Findings of the Association for Computational Linguistics: ACL 2026, pages 15587–15607, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: SEC-FinTables: Evaluating Large Language Models for Detecting Logical Inconsistencies on Tabular Data (Ke et al., Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.764.pdf
Checklist:: 2026.findings-acl.764.checklist.pdf

PDF Cite Search Checklist Fix data