Hybrid Communication with TCA and InfiniBand on a Parallel Programming Language XcalableACC for GPU Clusters

For the execution of parallel HPC applications on GPU-ready clusters, high communication latency between GPUs over nodes will be a serious problem on strong scalability. To reduce the communication latency between GPUs, we proposed the Tightly Coupled Accelerator (TCA) architecture and developed the...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Proceedings / IEEE International Conference on Cluster Computing S. 627 - 634
Hauptverfasser: Odajima, Tetsuya, Boku, Taisuke, Hanawa, Toshihiro, Murai, Hitoshi, Nakao, Masahiro, Tabuchi, Akihiro, Sato, Mitsuhisa
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 01.09.2015
Schlagworte:
ISSN:1552-5244
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!