Onyx: A 12nm 756 GOPS/W Coarse-Grained Reconfigurable Array for Accelerating Dense and Sparse Applications

Onyx is the first fully programmable accelerator for arbitrary sparse tensor algebra kernels. Unlike prior work, it supports higher-order tensors, multiple inputs, and fusion. It achieves this with a coarse-grained reconfigurable array (CGRA) that has composable memory primitives for storing compres...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Digest of technical papers - Symposium on VLSI Technology s. 1 - 2
Hlavní autoři: Koul, Kalhan, Strange, Maxwell, Melchert, Jackson, Carsello, Alex, Mei, Yuchen, Hsu, Olivia, Kong, Taeyoung, Chen, Po-Han, Ke, Huifeng, Zhang, Keyi, Liu, Qiaoyi, Nyengele, Gedeon, Balasingam, Akhilesh, Adivarahan, Jayashree, Sharma, Ritvik, Xie, Zhouhua, Torng, Christopher, Emer, Joel, Kjolstad, Fredrik, Horowitz, Mark, Raina, Priyanka
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 16.06.2024
Témata:
ISSN:2158-9682
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.