Invited Paper: Software/Hardware Co-design for LLM and Its Application for Design Verification
The widespread adoption of Large Language Models (LLMs) is impeded by their demanding compute and memory resources. The first task of this paper is to explore optimization strategies to expedite LLMs, including quantization, pruning, and operation-level optimizations. One unique direction is to opti...
Uloženo v:
| Vydáno v: | Proceedings of the ASP-DAC ... Asia and South Pacific Design Automation Conference s. 435 - 441 |
|---|---|
| Hlavní autoři: | , , , , , , |
| Médium: | Konferenční příspěvek |
| Jazyk: | angličtina |
| Vydáno: |
IEEE
22.01.2024
|
| Témata: | |
| ISSN: | 2153-697X |
| On-line přístup: | Získat plný text |
| Tagy: |
Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
|
Buďte první, kdo okomentuje tento záznam!