Extracting ultra-scale Lattice Boltzmann performance via hierarchical and distributed auto-tuning

We are witnessing a rapid evolution of HPC node architectures and on-chip parallelism as power and cooling constraints limit increases in microprocessor clock speeds. In this work, we demonstrate a hierarchical approach towards effectively extracting performance for a variety of emerging multicore-b...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:2011 International Conference for High Performance Computing, Networking, Storage and Analysis (SC) S. 1 - 12
Hauptverfasser: Williams, Samuel, Oliker, Leonid, Carter, Jonathan, Shalf, John
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: New York, NY, USA ACM 12.11.2011
IEEE
Schriftenreihe:ACM Conferences
Schlagworte:
ISBN:145030771X, 9781450307710
ISSN:2167-4329
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!