Multimodal Fusion for Thai Sign Language Recognition: Integrating RGB-Based CNN and Landmark-Based Features for Enhanced Gesture Recognition

This paper introduces a multimodal fusion model designed to improve the recognition of Thai Sign Language (TSL) gestures by combining RGB-based spatial features with landmark-based skeletal information. The proposed model employs ResNet-50, a deep Convolutional Neural Network (CNN) pre-trained on Im...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	2025 13th International Electrical Engineering Congress (iEECON) S. 1 - 5
Hauptverfasser:	Vijitkunsawat, Wuttichai, Sopin, Anan, Sathusen, Anusorn
Format:	Tagungsbericht
Sprache:	Englisch
Veröffentlicht:	IEEE 05.03.2025
Schlagworte:	Accuracy Convolutional neural networks Deep learning deep learning models Electrical engineering Feature extraction Hands landmark-based Libraries multi-modal RGB-based Robustness Sign language sign language recognition Visualization
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Schreiben Sie den ersten Kommentar!