PRT: An Efficient Pipeline Reuse Technology for Large Models Training

The rapid evolution of large models and the widespread application of extensive datasets have made the cost of training increasingly prohibitive. While pipeline model parallelism makes it possible to train large models, existing pipeline techniques find it difficult to reduce bubble time due to thei...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Proceedings / IEEE International Conference on Cluster Computing S. 1 - 11
Hauptverfasser: Ji, Zeyu, Zhai, Banghao, Zhang, Zhonghao, Chu, Qi, Liu, Bin
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 02.09.2025
Schlagworte:
ISSN:2168-9253
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!