Failures are Treasures: Constructing a Pedagogical Bridge for Agentic Strategy Distillation

Jiaxin Guo; Hao Sun; Wenhao Zhang; Chunyu Yang; Yan Zhang

Failures are Treasures: Constructing a Pedagogical Bridge for Agentic Strategy Distillation

Jiaxin Guo, Hao Sun, Wenhao Zhang, Chunyu Yang, Yan Zhang

Abstract

While Large Language Models (LLMs) excel in autonomous agent settings, small language models (SLMs) remain fragile, often collapsing after encountering errors. Traditional knowledge distillation focuses on imitating successful trajectories, while existing "learning from mistakes" methods treat errors as auxiliary signals rather than states requiring recoverable policies, leaving the dynamics of failure and recovery in agent settings largely unexplored. Inspired by Donald Schön’s theory of reflective practice, we propose P-BRIDGE (Pedagogical Bridge for Reflective Insight and Distillation of Guiding Errors). P-BRIDGE combines reflection-in-action with reflection-on-action, enabling agents to diagnose and correct critical errors during execution while abstracting transferable strategies from contrastive student–teacher trajectories. Experiments across eight benchmarks demonstrate that P-BRIDGE significantly elevates SLM performance—e.g., raising the 2WikiMultiHopQA accuracy of a 0.6B model from 6.2% to 34.2%.

Anthology ID:: 2026.findings-acl.938
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 18808–18823
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.938/
DOI:
Bibkey:
Cite (ACL):: Jiaxin Guo, Hao Sun, Wenhao Zhang, Chunyu Yang, and Yan Zhang. 2026. Failures are Treasures: Constructing a Pedagogical Bridge for Agentic Strategy Distillation. In Findings of the Association for Computational Linguistics: ACL 2026, pages 18808–18823, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: Failures are Treasures: Constructing a Pedagogical Bridge for Agentic Strategy Distillation (Guo et al., Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.938.pdf
Checklist:: 2026.findings-acl.938.checklist.pdf

PDF Cite Search Checklist Fix data