High-Speed Data Communication With Advanced Networks in Large Language Model Training

Large language models (LLMs) like Generative Pre-trained Transformer, Bidirectional Encoder Representations from Transformers, and T5 are pivotal in natural language processing. Their distributed training is influenced by high-speed interconnects. This article characterizes their training performanc...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	IEEE MICRO Ročník 44; číslo 2; s. 31 - 40
Hlavní autoři:	Dai, Liuyao, Qi, Hao, Chen, Weicong, Lu, Xiaoyi
Médium:	Journal Article
Jazyk:	angličtina
Vydáno:	Los Alamitos IEEE 01.03.2024 The Institute of Electrical and Electronics Engineers, Inc. (IEEE)
Témata:	Communication Computational modeling Data communication Data models Decoding High speed Interconnections IP (Internet Protocol) Large language models Natural language processing Parallel processing Synchronization TCP/IP (protocol) TCPIP Training Transformers
ISSN:	0272-1732, 1937-4143
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!