Blocking vs. non-blocking coordinated checkpointing for large-scale fault tolerant MPI

A long-term trend in high-performance computing is the increasing number of nodes in parallel computing platforms, which entails a higher failure probability. Fault tolerant programming environments should be used to guarantee the safe execution of critical applications. Research in fault tolerant M...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Conference on High Performance Networking and Computing: Proceedings of the 2006 ACM/IEEE conference on Supercomputing; 11-17 Nov. 2006 S. 127 - es
Hauptverfasser: Coti, Camille, Herault, Thomas, Lemarinier, Pierre, Pilard, Laurence, Rezmerita, Ala, Rodriguez, Eric, Cappello, Franck
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: New York, NY, USA ACM 11.11.2006
Schriftenreihe:ACM Conferences
Schlagworte:
ISBN:0769527000, 9780769527000
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!