High-Speed Data Communication With Advanced Networks in Large Language Model Training

Large language models (LLMs) like Generative Pre-trained Transformer, Bidirectional Encoder Representations from Transformers, and T5 are pivotal in natural language processing. Their distributed training is influenced by high-speed interconnects. This article characterizes their training performanc...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:IEEE MICRO Ročník 44; číslo 2; s. 31 - 40
Hlavní autoři: Dai, Liuyao, Qi, Hao, Chen, Weicong, Lu, Xiaoyi
Médium: Journal Article
Jazyk:angličtina
Vydáno: Los Alamitos IEEE 01.03.2024
The Institute of Electrical and Electronics Engineers, Inc. (IEEE)
Témata:
ISSN:0272-1732, 1937-4143
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.