Multimodal Fusion for Thai Sign Language Recognition: Integrating RGB-Based CNN and Landmark-Based Features for Enhanced Gesture Recognition

This paper introduces a multimodal fusion model designed to improve the recognition of Thai Sign Language (TSL) gestures by combining RGB-based spatial features with landmark-based skeletal information. The proposed model employs ResNet-50, a deep Convolutional Neural Network (CNN) pre-trained on Im...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:2025 13th International Electrical Engineering Congress (iEECON) s. 1 - 5
Hlavní autoři: Vijitkunsawat, Wuttichai, Sopin, Anan, Sathusen, Anusorn
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 05.03.2025
Témata:
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.