A Fault-Model-Relevant Classification of Consensus Mechanisms for MPI and HPC
Large-scale HPC systems experience failures arising from faults in hardware, software, and/or networking. Failure rates continue to grow as systems scale up and out. Crash fault tolerance has up to now been the focus when considering means to augment the Message Passing Interface (MPI) for fault-tol...
Uložené v:
| Vydané v: | International journal of parallel programming Ročník 51; číslo 2-3; s. 128 - 149 |
|---|---|
| Hlavní autori: | , , |
| Médium: | Journal Article |
| Jazyk: | English |
| Vydavateľské údaje: |
New York
Springer US
01.06.2023
Springer Nature B.V |
| Predmet: | |
| ISSN: | 0885-7458, 1573-7640 |
| On-line prístup: | Získať plný text |
| Tagy: |
Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
|
Buďte prvý, kto okomentuje tento záznam!