HiCMAE: Hierarchical Contrastive Masked Autoencoder for self-supervised Audio-Visual Emotion Recognition

Audio-Visual Emotion Recognition (AVER) has garnered increasing attention in recent years for its critical role in creating emotion-aware intelligent machines. Previous efforts in this area are dominated by the supervised learning paradigm. Despite significant progress, supervised learning is meetin...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	Information fusion Ročník 108; s. 102382
Hlavní autoři:	Sun, Licai, Lian, Zheng, Liu, Bin, Tao, Jianhua
Médium:	Journal Article
Jazyk:	angličtina
Vydáno:	Elsevier B.V 01.08.2024
Témata:	Audio-Visual Emotion Recognition Contrastive learning Masked autoencoder Self-supervised learning Audio-Visual Emotion Recognition Masked autoencoder Self-supervised learning Contrastive learning
ISSN:	1566-2535, 1872-6305
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!