Algorithmic strategies for optimizing the parallel reduction primitive in CUDA
Many general-purpose applications exploit Graphics Processing Units (GPUs) by executing a set of well-known dataparallel primitives. Those primitives are usually invoked from the host many times, so their throughput has a great impact on the performance of the overall system. Thus, the study of nove...
Gespeichert in:
| Veröffentlicht in: | 2012 International Conference on High Performance Computing and Simulation S. 511 - 519 |
|---|---|
| Hauptverfasser: | , , , |
| Format: | Tagungsbericht |
| Sprache: | Englisch |
| Veröffentlicht: |
IEEE
01.07.2012
|
| Schlagworte: | |
| ISBN: | 9781467323598, 1467323594 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!

