Checkpointing Orchestration: Toward a Scalable HPC Fault-Tolerant Environment

Check pointing is widely used in technical computing. However, the overhead of check pointing is a subject of increasing in concern in recent years, especially for large-scale parallel computer systems. In these systems, check pointing generates a huge number of concurrent I/O writes. The burst of w...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:2012 12th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing s. 276 - 283
Hlavní autoři: Hui Jin, Tao Ke, Yong Chen, Xian-He Sun
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 01.05.2012
Témata:
ISBN:1467313955, 9781467313957
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.