Head-wise Shareable Attention for Large Language Models

Anthology ID:: 2024.findings-emnlp.144
Original:: 2024.findings-emnlp.144v1
Version 2:: 2024.findings-emnlp.144v2
Volume:: Findings of the Association for Computational Linguistics: EMNLP 2024
Month:: November
Year:: 2024
Address:: Miami, Florida, USA
Editors:: Yaser Al-Onaizan, Mohit Bansal, Yun-Nung Chen
Venue:: Findings
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 2555–2571
Language:
URL:: https://preview.aclanthology.org/jlcl-multiple-ingestion/2024.findings-emnlp.144/
DOI:: 10.18653/v1/2024.findings-emnlp.144
Bibkey:
Cite (ACL):: Zouying Cao, Yifei Yang, and Hai Zhao. 2024. Head-wise Shareable Attention for Large Language Models. In Findings of the Association for Computational Linguistics: EMNLP 2024, pages 2555–2571, Miami, Florida, USA. Association for Computational Linguistics.
Cite (Informal):: Head-wise Shareable Attention for Large Language Models (Cao et al., Findings 2024)
Copy Citation:
PDF:: https://preview.aclanthology.org/jlcl-multiple-ingestion/2024.findings-emnlp.144.pdf
Software:: 2024.findings-emnlp.144.software.zip