Context-Aware Visual Policy Network for Fine-Grained Image Captioning

Context-Aware Visual Policy Network for Fine-Grained Image Captioning

6 June 2019

Papers citing "Context-Aware Visual Policy Network for Fine-Grained Image Captioning"

11 / 11 papers shown

Title
Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning Mozhgan Pourkeshavarz Shahabedin Nabavi Mohsen Moghaddam M. Shamsfard 29 4 0 08 Feb 2023
IC3: Image Captioning by Committee Consensus David M. Chan Austin Myers Sudheendra Vijayanarasimhan David A. Ross John F. Canny 26 17 0 02 Feb 2023
Learning to Collocate Visual-Linguistic Neural Modules for Image Captioning Xu Yang Hanwang Zhang Chongyang Gao Jianfei Cai MLLM 37 10 0 04 Oct 2022
EMScore: Evaluating Video Captioning via Coarse-Grained and Fine-Grained Embedding Matching Yaya Shi Xu Yang Haiyang Xu Chunfen Yuan Bing Li Weiming Hu Zhengjun Zha 36 33 0 17 Nov 2021
From Show to Tell: A Survey on Deep Learning-based Image Captioning Matteo Stefanini Marcella Cornia Lorenzo Baraldi S. Cascianelli G. Fiameni Rita Cucchiara 3DV VLM MLLM 55 254 0 14 Jul 2021
Teacher-Critical Training Strategies for Image Captioning Yiqing Huang Jiansheng Chen VLM 10 8 0 30 Sep 2020
Learning to Discretely Compose Reasoning Module Networks for Video Captioning Ganchao Tan Daqing Liu Meng Wang Zhengjun Zha LRM 21 73 0 17 Jul 2020
Object Relational Graph with Teacher-Recommended Learning for Video Captioning Ziqi Zhang Yaya Shi Chunfen Yuan Bing Li Peijin Wang Weiming Hu Zhengjun Zha VLM 18 271 0 26 Feb 2020
Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask Learning Huaizheng Zhang Yong Luo Qiming Ai Yonggang Wen 9 15 0 21 Dec 2019
Building machines that adapt and compute like brains Brenden Lake J. Tenenbaum AI4CE FedML NAI AILaw 254 890 0 11 Nov 2017
Visual Translation Embedding Network for Visual Relation Detection Hanwang Zhang Zawlin Kyaw Shih-Fu Chang Tat-Seng Chua ViT 140 560 0 27 Feb 2017