Suchergebnisse - "algorithm-based fault tolerance"
-
1
Algorithm-Based Fault Tolerance for Parallel Stencil Computations
ISSN: 2168-9253Veröffentlicht: IEEE 01.09.2019Veröffentlicht in Proceedings / IEEE International Conference on Cluster Computing (01.09.2019)“… This work proposes a novel algorithm-based fault tolerance (ABFT) method to protect scientific applications that contain arbitrary …”
Volltext
Tagungsbericht -
2
Algorithm-Based Fault Tolerance for Parallel Stencil Computations
ISSN: 2331-8422Veröffentlicht: Ithaca Cornell University Library, arXiv.org 02.09.2019Veröffentlicht in arXiv.org (02.09.2019)“… This work proposes a novel algorithm-based fault tolerance (ABFT) method to protect scientific applications that contain arbitrary …”
Volltext
Paper -
3
Algorithm-Based Fault Tolerance Applied to P2P Computing Networks
ISBN: 1424450845, 9781424450848Veröffentlicht: IEEE 01.10.2009Veröffentlicht in 2009 First International Conference on Advances in P2P Systems (01.10.2009)“… P2P computing platforms are subject to a wide range of attacks. In this paper, we propose a generalisation of the previous disk-less checkpointing approach for fault-tolerance in high performance computing systems …”
Volltext
Tagungsbericht -
4
Tests and tolerances for high-performance software-implemented fault detection
ISSN: 0018-9340Veröffentlicht: 01.05.2003Veröffentlicht in IEEE transactions on computers (01.05.2003)Volltext
Journal Article -
5
Self-stabilizing Connected Components
Veröffentlicht: IEEE 01.11.2019Veröffentlicht in 2019 IEEE/ACM 9th Workshop on Fault Tolerance for HPC at eXtreme Scale (FTXS) (01.11.2019)“… Therefore on a machine subject to a transient fault, a self-stabilizing algorithm could recover if that fault caused the system to enter an invalid state …”
Volltext
Tagungsbericht -
6
Node failure resiliency for Uintah without checkpointing
ISSN: 1532-0626, 1532-0634Veröffentlicht: Hoboken Wiley Subscription Services, Inc 25.10.2019Veröffentlicht in Concurrency and computation (25.10.2019)“… intermediate memory may help. Algorithm‐based fault tolerance (ABFT) using adaptive mesh refinement (AMR …”
Volltext
Journal Article -
7
Tests and tolerances for high-performance software-implemehted fault detection
ISSN: 0018-9340, 1557-9956Veröffentlicht: New York IEEE 01.05.2003Veröffentlicht in IEEE transactions on computers (01.05.2003)“… Such result checking or algorithm-based fault tolerance (ABFT) methods may be used, for example, to overcome single-event upsets in computational hardware or to detect errors in complex, high-efficiency implementations of the algorithms …”
Volltext
Journal Article

