Bangla Image Caption Generation Using Vision Transformer (ViT) Based Model

In the era of digital content and visual communication, Bangla image captioning has emerged as a crucial technology for enhancing accessibility, improving content discoverability, and bridging the language gap for millions of Bangla speakers worldwide. Our work proposes a novel approach combining a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:2025 International Conference on Electrical, Computer and Communication Engineering (ECCE) S. 1 - 6
Hauptverfasser: Sarker, Arpita, Das, Udoy, Murad, Hasan
Format: Tagungsbericht
Sprache:Englisch
Veröffentlicht: IEEE 13.02.2025
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!