Auto-tuning 3-D FFT library for CUDA GPUs

Existing implementations of FFTs on GPUs are optimized for specific transform sizes like powers of two, and exhibit unstable and peaky performance i.e., do not perform as well in other sizes that appear in practice. Our new auto-tuning 3-D FFT on CUDA generates high performance CUDA kernels for FFTs...

Celý popis

Uložené v:
Podrobná bibliografia
Vydané v:Proceedings of the Conference on High Performance Computing Networking, Storage and Analysis s. 1 - 10
Hlavní autori: Nukada, Akira, Matsuoka, Satoshi
Médium: Konferenčný príspevok..
Jazyk:English
Vydavateľské údaje: New York, NY, USA ACM 14.11.2009
Edícia:ACM Conferences
Predmet:
ISBN:1605587443, 9781605587448
ISSN:2167-4329
On-line prístup:Získať plný text
Tagy: Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
Buďte prvý, kto okomentuje tento záznam!
Najprv sa musíte prihlásiť.