Checkpointing Orchestration: Toward a Scalable HPC Fault-Tolerant Environment

Check pointing is widely used in technical computing. However, the overhead of check pointing is a subject of increasing in concern in recent years, especially for large-scale parallel computer systems. In these systems, check pointing generates a huge number of concurrent I/O writes. The burst of w...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:2012 12th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing S. 276 - 283
Hauptverfasser: Hui Jin, Tao Ke, Yong Chen, Xian-He Sun
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 01.05.2012
Schlagworte:
ISBN:1467313955, 9781467313957
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!