Rep ViT: Revisiting Mobile CNN From ViT Perspective

Recently, lightweight Vision Transformers (ViTs) demon-strate superior performance and lower latency, compared with lightweight Convolutional Neural Networks (CNNs), on resource-constrained mobile devices. Researchers have discovered many structural connections be-tween lightweight ViTs and lightwei...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) s. 15909 - 15920
Hlavní autoři:	Wang, Ao, Chen, Hui, Lin, Zijia, Han, Jungong, Ding, Guiguang
Médium:	Konferenční příspěvek
Jazyk:	angličtina
Vydáno:	IEEE 16.06.2024
Témata:	Accuracy CNN Codes Computational modeling Computer vision Mobile handsets Performance evaluation Transformers ViT
ISSN:	1063-6919
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!