Context-Aware Visual Policy Network for Fine-Grained Image Captioning

Context-Aware Visual Policy Network for Fine-Grained Image Captioning

6 June 2019

Papers citing "Context-Aware Visual Policy Network for Fine-Grained Image Captioning"

12 / 12 papers shown

Title
Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning Mozhgan Pourkeshavarz Shahabedin Nabavi Mohsen Moghaddam M. Shamsfard 31 4 0 08 Feb 2023
IC3: Image Captioning by Committee Consensus David M. Chan Austin Myers Sudheendra Vijayanarasimhan David A. Ross John F. Canny 32 17 0 02 Feb 2023
Learning to Collocate Visual-Linguistic Neural Modules for Image Captioning Xu Yang Hanwang Zhang Chongyang Gao Jianfei Cai MLLM 37 10 0 04 Oct 2022
EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching Yaya Shi Xu Yang Haiyang Xu Chunfen Yuan Bing Li Weiming Hu Zhengjun Zha 39 33 0 17 Nov 2021
Exploring Sequence Feature Alignment for Domain Adaptive Detection Transformers Wen Wang Yang Cao Jing Zhang Fengxiang He Zhengjun Zha Yonggang Wen Dacheng Tao ViT 15 94 0 27 Jul 2021
From Show to Tell: A Survey on Deep Learning-based Image Captioning Matteo Stefanini Marcella Cornia Lorenzo Baraldi S. Cascianelli G. Fiameni Rita Cucchiara 3DV VLM MLLM 64 254 0 14 Jul 2021
Teacher-Critical Training Strategies for Image Captioning Yiqing Huang Jiansheng Chen VLM 21 8 0 30 Sep 2020
Learning to Discretely Compose Reasoning Module Networks for Video Captioning Ganchao Tan Daqing Liu Meng Wang Zhengjun Zha LRM 25 73 0 17 Jul 2020
Object Relational Graph with Teacher-Recommended Learning for Video Captioning Ziqi Zhang Yaya Shi Chunfen Yuan Bing Li Peijin Wang Weiming Hu Zhengjun Zha VLM 23 271 0 26 Feb 2020
Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask Learning Huaizheng Zhang Yong Luo Qiming Ai Yonggang Wen 17 15 0 21 Dec 2019
Building machines that adapt and compute like brains Brenden Lake J. Tenenbaum AI4CE FedML NAI AILaw 254 890 0 11 Nov 2017
Visual Translation Embedding Network for Visual Relation Detection Hanwang Zhang Zawlin Kyaw Shih-Fu Chang Tat-Seng Chua ViT 145 560 0 27 Feb 2017