Invited Paper: Software/Hardware Co-design for LLM and Its Application for Design Verification

The widespread adoption of Large Language Models (LLMs) is impeded by their demanding compute and memory resources. The first task of this paper is to explore optimization strategies to expedite LLMs, including quantization, pruning, and operation-level optimizations. One unique direction is to opti...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Proceedings of the ASP-DAC ... Asia and South Pacific Design Automation Conference s. 435 - 441
Hlavní autoři: Wan, Lily Jiaxin, Huang, Yingbing, Li, Yuhong, Ye, Hanchen, Wang, Jinghua, Zhang, Xiaofan, Chen, Deming
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 22.01.2024
Témata:
ISSN:2153-697X
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.