Vision Transformer and Residual Network-Based Autoencoder for RGBD Data Processing in Robotic Grasping of Noodle-Like Objects

In this innovative study, a Vision Transformer and Residual Network-based Autoencoder is employed for the efficient encoding of RGBD data, aimed at enhancing robotic precision in grasping noodle-like objects. The project successfully compresses 50x50 pixel RGBD images to a 1024-element format, optim...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:2024 1st International Conference on Robotics, Engineering, Science, and Technology (RESTCON) S. 85 - 89
Hauptverfasser: Koomklang, Nattapat, Gamolped, Prem, Hayashi, Eiji
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 16.02.2024
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!