MIST: Multimodal emotion recognition using DeBERTa for text, Semi-CNN for speech, ResNet-50 for facial, and 3D-CNN for motion analysis

Human emotion recognition is a rapidly evolving field in artificial intelligence, crucial for improving human–computer interaction. This paper introduces the MIST (Motion, Image, Speech, and Text) framework, a novel multimodal approach to emotion recognition that integrates diverse data modalities....

Full description

Saved in:

Bibliographic Details
Published in:	Expert systems with applications Vol. 270; p. 126236
Main Authors:	Boitel, Enguerrand, Mohasseb, Alaa, Haig, Ella
Format:	Journal Article
Language:	English
Published:	Elsevier Ltd 25.04.2025
Subjects:	BAUM-1 dataset Data stream integration Deep learning models Face emotion recognition (FER) MIST framework Motion emotion recognition (MER) Multimodal emotion recognition SAVEE dataset Speech emotion recognition (SER) Text emotion recognition (TER) Face emotion recognition (FER) Motion emotion recognition (MER) Deep learning models SAVEE dataset Text emotion recognition (TER) BAUM-1 dataset Multimodal emotion recognition MIST framework Data stream integration Speech emotion recognition (SER)
ISSN:	0957-4174
Online Access:	Get full text
Tags:	Add Tag No Tags, Be the first to tag this record!

Be the first to leave a comment!