A visual question answering method based on task decomposition
Visual question answering (VQA) as an interdisciplinary task of computer vision and natural language processing, estimating the model’s visual reasoning ability, which requires the integration of image information extraction technology and natural language understanding technology. The testing on pr...
Uloženo v:
| Vydáno v: | PloS one Ročník 20; číslo 11; s. e0336623 |
|---|---|
| Hlavní autoři: | , |
| Médium: | Journal Article |
| Jazyk: | angličtina |
| Vydáno: |
United States
Public Library of Science
13.11.2025
Public Library of Science (PLoS) |
| Témata: | |
| ISSN: | 1932-6203, 1932-6203 |
| On-line přístup: | Získat plný text |
| Tagy: |
Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
|
Buďte první, kdo okomentuje tento záznam!