Bimodal variational autoencoder for audiovisual speech recognition

Multimodal fusion is the idea of combining information in a joint representation of multiple modalities. The goal of multimodal fusion is to improve the accuracy of results from classification or regression tasks. This paper proposes a Bimodal Variational Autoencoder (BiVAE) model for audiovisual fe...

Celý popis

Uloženo v:

Podrobná bibliografie
Vydáno v:	Machine learning Ročník 112; číslo 4; s. 1201 - 1226
Hlavní autoři:	Sayed, Hadeer M., ElDeeb, Hesham E., Taie, Shereen A.
Médium:	Journal Article
Jazyk:	angličtina
Vydáno:	New York Springer US 01.04.2023 Springer Nature B.V
Témata:	Accuracy Artificial Intelligence Artificial neural networks Classifiers Computer Science Control Discovery Science 2020 Evaluation Machine Learning Mechatronics Natural Language Processing (NLP) Robotics Simulation and Modeling Speech recognition Support vector machines Video signals Voice recognition Deep learning Variational autoencoder Cross-modality Multimodal data fusion Audiovisual speech recognition
ISSN:	0885-6125, 1573-0565
On-line přístup:	Získat plný text
Tagy:	Přidat tag Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!

Buďte první, kdo okomentuje tento záznam!