Evaluating Counterfactual Strategic Reasoning in Large Language Models

Dimitrios Georgousis; Maria Lymperaiou; Angeliki Dimitriou; Giorgos Filandrianos; Giorgos Stamou

Evaluating Counterfactual Strategic Reasoning in Large Language Models

Dimitrios Georgousis, Maria Lymperaiou, Angeliki Dimitriou, Giorgos Filandrianos, Giorgos Stamou

Abstract

We evaluate whether LLMs adapt their strategic behavior when familiar games are counterfactually modified. We introduce a repeated-game evaluation framework covering Prisoner’s Dilemma and Rock–Paper–Scissors under default, label-perturbed, payoff-perturbed, and joint counterfactual variants. This design separates surface robustness to renamed actions from deeper sensitivity to changed incentives. Across multiple frontier LLMs, we find that label perturbations usually cause moderate degradation, whereas payoff perturbations expose stronger failures: LLMs often preserve canonical strategies even when the equilibrium structure changes. In RPS, several LLMs remain close to uniform play despite a payoff-counterfactual equilibrium requiring a biased mixed strategy. Behavioral and efficiency metrics further show that stronger or reasoning-enabled LLMs are not uniformly more strategic: some deliberate more without adapting faster. Overall, counterfactual repeated games provide a compact diagnostic for distinguishing robust incentive-sensitive behavior from brittle template-based strategic execution.

Anthology ID:: 2026.gem-main.31
Volume:: Proceedings of the Fifth Workshop on Generation, Evaluation and Metrics (GEM)
Month:: July
Year:: 2026
Address:: San Diego, California, USA
Editors:: Simon Mille, Sebastian Gehrmann, Patrícia Schmidtová, Ondřej Dušek, Marzieh Fadaee, Kyle Lo, Enrico Santus, Gabriel Stanovsky
Venues:: GEM | WS
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 309–354
Language:
URL:: https://preview.aclanthology.org/ingest-acl-workshops/2026.gem-main.31/
DOI:
Bibkey:
Cite (ACL):: Dimitrios Georgousis, Maria Lymperaiou, Angeliki Dimitriou, Giorgos Filandrianos, and Giorgos Stamou. 2026. Evaluating Counterfactual Strategic Reasoning in Large Language Models. In Proceedings of the Fifth Workshop on Generation, Evaluation and Metrics (GEM), pages 309–354, San Diego, California, USA. Association for Computational Linguistics.
Cite (Informal):: Evaluating Counterfactual Strategic Reasoning in Large Language Models (Georgousis et al., GEM 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl-workshops/2026.gem-main.31.pdf

PDF Cite Search Fix data