v1v2 (latest)

Dual Attention on Pyramid Feature Maps for Image Captioning

IEEE transactions on multimedia (TMM), 2020

2 November 2020

Papers citing "Dual Attention on Pyramid Feature Maps for Image Captioning"

11 / 11 papers shown

Embedded Heterogeneous Attention Transformer for Cross-lingual Image CaptioningIEEE transactions on multimedia (IEEE TMM), 2023

Zijie Song

Zhenzhen Hu

Yuanen Zhou

Ye Zhao

Richang Hong

Meng Wang

243

19 Jul 2023

Neighborhood Contrastive Transformer for Change CaptioningIEEE transactions on multimedia (IEEE TMM), 2023

Yunbin Tu

240

06 Mar 2023

DilateFormer: Multi-Scale Dilated Transformer for Visual RecognitionIEEE transactions on multimedia (IEEE TMM), 2023

Yaowei Wang

337

276

03 Feb 2023

DEVICE: Depth and Visual Concepts Aware Transformer for OCR-based Image CaptioningPattern Recognition (Pattern Recogn.), 2023

593

03 Feb 2023

HGAN: Hierarchical Graph Alignment Network for Image-Text RetrievalIEEE transactions on multimedia (IEEE TMM), 2022

251

16 Dec 2022

OSIC: A New One-Stage Image Captioner CoinedInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Meng Wang

267

04 Nov 2022

Hierarchical Local-Global Transformer for Temporal Sentence GroundingIEEE transactions on multimedia (IEEE TMM), 2022

349

31 Aug 2022

Label Semantic Knowledge Distillation for Unbiased Scene Graph Generation

Yi Yang

292

07 Aug 2022

Horizontal and Vertical Attention in Transformers

Litao Yu

Shuai Liu

ViT

187

10 Jul 2022

Geometry Attention Transformer with Position-aware LSTMs for Image Captioning

Chi-Yin Wang

Yulin Shen

Luping Ji

ViT

260

01 Oct 2021

Cross Modification Attention Based Deliberation Model for Image Captioning

157

17 Sep 2021