Hybrid Communication with TCA and InfiniBand on a Parallel Programming Language XcalableACC for GPU Clusters

For the execution of parallel HPC applications on GPU-ready clusters, high communication latency between GPUs over nodes will be a serious problem on strong scalability. To reduce the communication latency between GPUs, we proposed the Tightly Coupled Accelerator (TCA) architecture and developed the...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:Proceedings / IEEE International Conference on Cluster Computing s. 627 - 634
Hlavní autoři: Odajima, Tetsuya, Boku, Taisuke, Hanawa, Toshihiro, Murai, Hitoshi, Nakao, Masahiro, Tabuchi, Akihiro, Sato, Mitsuhisa
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 01.09.2015
Témata:
ISSN:1552-5244
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.