The Mark Fades: Adaptive Evolutionary Paraphrase-based Attack against LLM Watermarks

Yusheng Zhao; Jian Zhao; Tianle Zhang; Feng Wei; Xuelong Li

The Mark Fades: Adaptive Evolutionary Paraphrase-based Attack against LLM Watermarks

Yusheng Zhao, Jian Zhao, Tianle Zhang, Feng Wei, Xuelong Li

Abstract

While LLM watermarking is essential for machine- generated content identification, existing paraphrase-based attacks struggle to balance watermark removal efficacy with text quality. We propose TSAPA, a training-free evolutionary framework that models watermark removal as a constrained multi-objective optimization problem. By leveraging genetic algorithms to navigate the Pareto front, TSAPA utilizes a Pseudo-Log-Likelihood (PLL)-guided mutation to precisely target and modify watermark-carrying tokens. Experiments on Qwen3 series (1.7B/8B/32B) across multiple watermark schemes show that TSAPA achieves over 90% attack success rate (ASR) while maintaining high text semantic fidelity, significantly outperforming baselines methods. This work exposes critical vulnerabilities in current watermarks and provides a new perspective for robust evaluation.

Anthology ID:: 2026.findings-acl.459
Volume:: Findings of the Association for Computational Linguistics: ACL 2026
Month:: July
Year:: 2026
Address:: San Diego, California, United States
Editors:: Maria Liakata, Viviane P. Moreira, Jiajun Zhang, David Jurgens
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 9428–9445
Language:
URL:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.459/
DOI:
Bibkey:
Cite (ACL):: Yusheng Zhao, Jian Zhao, Tianle Zhang, Feng Wei, and Xuelong Li. 2026. The Mark Fades: Adaptive Evolutionary Paraphrase-based Attack against LLM Watermarks. In Findings of the Association for Computational Linguistics: ACL 2026, pages 9428–9445, San Diego, California, United States. Association for Computational Linguistics.
Cite (Informal):: The Mark Fades: Adaptive Evolutionary Paraphrase-based Attack against LLM Watermarks (Zhao et al., Findings 2026)
Copy Citation:
PDF:: https://preview.aclanthology.org/ingest-acl/2026.findings-acl.459.pdf
Checklist:: 2026.findings-acl.459.checklist.pdf

PDF Cite Search Checklist Fix data