Multimodal Fusion for Thai Sign Language Recognition: Integrating RGB-Based CNN and Landmark-Based Features for Enhanced Gesture Recognition

This paper introduces a multimodal fusion model designed to improve the recognition of Thai Sign Language (TSL) gestures by combining RGB-based spatial features with landmark-based skeletal information. The proposed model employs ResNet-50, a deep Convolutional Neural Network (CNN) pre-trained on Im...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	2025 13th International Electrical Engineering Congress (iEECON) s. 1 - 5
Hlavní autoři:	Vijitkunsawat, Wuttichai, Sopin, Anan, Sathusen, Anusorn
Médium:	Konferenční příspěvek
Jazyk:	angličtina
Vydáno:	IEEE 05.03.2025
Témata:	Accuracy Convolutional neural networks Deep learning deep learning models Electrical engineering Feature extraction Hands landmark-based Libraries multi-modal RGB-based Robustness Sign language sign language recognition Visualization
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!