Rep ViT: Revisiting Mobile CNN From ViT Perspective

Recently, lightweight Vision Transformers (ViTs) demon-strate superior performance and lower latency, compared with lightweight Convolutional Neural Networks (CNNs), on resource-constrained mobile devices. Researchers have discovered many structural connections be-tween lightweight ViTs and lightwei...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	Proceedings (IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Online) S. 15909 - 15920
Hauptverfasser:	Wang, Ao, Chen, Hui, Lin, Zijia, Han, Jungong, Ding, Guiguang
Format:	Tagungsbericht
Sprache:	Englisch
Veröffentlicht:	IEEE 16.06.2024
Schlagworte:	Accuracy CNN Codes Computational modeling Computer vision Mobile handsets Performance evaluation Transformers ViT
ISSN:	1063-6919
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!