HiCoS-Net: hierarchical cross-modal graph learning with dynamic attention for hard negative-aware image-text matching

Fine-grained image-text matching, which is pivotal to multimodal intelligence, has advanced semantic correspondence inference through inter-modal region-word aggregation. Despite the efficacy of this approach, it remains limited by its inability to accommodate the semantic associations of hard negat...

Celý popis

Uložené v:
Podrobná bibliografia
Vydané v:Journal of King Saud University. Computer and information sciences Ročník 37; číslo 9; s. 281 - 30
Hlavní autori: Feng, Dingcheng, Luo, Ning, Zhang, Shudong, Zhou, Lijuan, Wei, Bing
Médium: Journal Article
Jazyk:English
Vydavateľské údaje: Cham Springer International Publishing 01.11.2025
Springer Nature B.V
Springer
Predmet:
ISSN:1319-1578, 2213-1248, 1319-1578
On-line prístup:Získať plný text
Tagy: Pridať tag
Žiadne tagy, Buďte prvý, kto otaguje tento záznam!
Buďte prvý, kto okomentuje tento záznam!
Najprv sa musíte prihlásiť.