Edge-LLM: A Collaborative Framework for Large Language Model Serving in Edge Computing

The rapid advancement and extensive implementation of Large Language Models (LLMs) are milestones in the realm of artificial intelligence. Although Parameter-Efficient Transfer Learning (PETL), a.k.a. Adapter, methods have reduced the barrier for fine-tuning and inference on LLMs, it becomes a chall...

Celý popis

Uložené v:
Podrobná bibliografia
Vydané v:Proceedings (IEEE International Conference on Web Services. Online) s. 799 - 809
Hlavní autori: Cai, Fenglong, Yuan, Dong, Yang, Zhe, Cui, Lizhen
Médium: Konferenčný príspevok..
Jazyk:English
Vydavateľské údaje: IEEE 07.07.2024
Predmet:
ISSN:2836-3868
On-line prístup:Získať plný text
Tagy: Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
Buďte prvý, kto okomentuje tento záznam!
Najprv sa musíte prihlásiť.