Kernel Tuner: A search-optimizing GPU code auto-tuner
A very common problem in GPU programming is that some combination of thread block dimensions and other code optimization parameters, like tiling or unrolling factors, results in dramatically better performance than other kernel configurations. To obtain highly-efficient kernels it is often required...
Uložené v:
| Vydané v: | Future generation computer systems Ročník 90; s. 347 - 358 |
|---|---|
| Hlavný autor: | |
| Médium: | Journal Article |
| Jazyk: | English |
| Vydavateľské údaje: |
Elsevier B.V
01.01.2019
|
| Predmet: | |
| ISSN: | 0167-739X, 1872-7115 |
| On-line prístup: | Získať plný text |
| Tagy: |
Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
|
Buďte prvý, kto okomentuje tento záznam!