A Fault-Model-Relevant Classification of Consensus Mechanisms for MPI and HPC

Large-scale HPC systems experience failures arising from faults in hardware, software, and/or networking. Failure rates continue to grow as systems scale up and out. Crash fault tolerance has up to now been the focus when considering means to augment the Message Passing Interface (MPI) for fault-tol...

Celý popis

Uložené v:
Podrobná bibliografia
Vydané v:International journal of parallel programming Ročník 51; číslo 2-3; s. 128 - 149
Hlavní autori: Nansamba, Grace, Altarawneh, Amani, Skjellum, Anthony
Médium: Journal Article
Jazyk:English
Vydavateľské údaje: New York Springer US 01.06.2023
Springer Nature B.V
Predmet:
ISSN:0885-7458, 1573-7640
On-line prístup:Získať plný text
Tagy: Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
Buďte prvý, kto okomentuje tento záznam!
Najprv sa musíte prihlásiť.