Exploring Visual Relationship for Image Captioning

19 September 2018

Ting Yao

Yingwei Pan

Yehao Li

Tao Mei

ArXiv PDF HTML

Papers citing "Exploring Visual Relationship for Image Captioning"

50 / 104 papers shown

Title
Scene Graph Generation for Better Image Captioning? Maximilian Mozes Martin Schmitt Vladimir Golkov Hinrich Schütze Daniel Cremers GNN 21 3 0 23 Sep 2021
A Survey on Temporal Sentence Grounding in Videos Xiaohan Lan Yitian Yuan Xin Eric Wang Zhi Wang Wenwu Zhu 27 47 0 16 Sep 2021
Learning to Generate Scene Graph from Natural Language Supervision Yiwu Zhong Jing Shi Jianwei Yang Chenliang Xu Yin Li SSL 31 77 0 06 Sep 2021
SketchLattice: Latticed Representation for Sketch Manipulation Yonggang Qi Guoyao Su Pinaki Nath Chowdhury Mingkang Li Yi-Zhe Song 35 23 0 26 Aug 2021
X-modaler: A Versatile and High-performance Codebase for Cross-modal Analytics Yehao Li Yingwei Pan Jingwen Chen Ting Yao Tao Mei VLM 19 31 0 18 Aug 2021
ROSITA: Enhancing Vision-and-Language Semantic Alignments via Cross- and Intra-modal Knowledge Integration Yuhao Cui Zhou Yu Chunqi Wang Zhongzhou Zhao Ji Zhang Meng Wang Jun-chen Yu VLM 19 53 0 16 Aug 2021
Dual Graph Convolutional Networks with Transformer and Curriculum Learning for Image Captioning Xinzhi Dong Chengjiang Long Wenju Xu Chunxia Xiao ViT 69 66 0 05 Aug 2021
From Show to Tell: A Survey on Deep Learning-based Image Captioning Matteo Stefanini Marcella Cornia Lorenzo Baraldi S. Cascianelli G. Fiameni Rita Cucchiara 3DV VLM MLLM 55 254 0 14 Jul 2021
Instance-Level Relative Saliency Ranking with Graph Reasoning Nian Liu Long Li Wangbo Zhao Junwei Han Ling Shao 22 27 0 08 Jul 2021
Recovering the Unbiased Scene Graphs from the Biased Ones Meng-Jiun Chiou Henghui Ding Hanshu Yan Changhu Wang Roger Zimmermann Jiashi Feng 39 113 0 05 Jul 2021
Structured Sparse R-CNN for Direct Scene Graph Generation Yao Teng Limin Wang 3DPC GNN 16 53 0 21 Jun 2021
Giving Commands to a Self-Driving Car: How to Deal with Uncertain Situations? Thierry Deruyttere Victor Milewski Marie-Francine Moens 28 15 0 08 Jun 2021
T-EMDE: Sketching-based global similarity for cross-modal retrieval Barbara Rychalska Mikolaj Wieczorek Jacek Dąbrowski 25 0 0 10 May 2021
Exploring Explicit and Implicit Visual Relationships for Image Captioning Zeliang Song Xiaofei Zhou 19 7 0 06 May 2021
Structured Co-reference Graph Attention for Video-grounded Dialogue Junyeong Kim Sunjae Yoon Dahyun Kim Chang-Dong Yoo 18 26 0 24 Mar 2021
Causal Attention for Vision-Language Tasks Xu Yang Hanwang Zhang Guojun Qi Jianfei Cai CML 23 148 0 05 Mar 2021
Towards Overcoming False Positives in Visual Relationship Detection Daisheng Jin Xiao Ma Chongzhi Zhang Yizhuo Zhou Jiashu Tao ... Haiyu Zhao Shuai Yi Zhoujun Li Xianglong Liu Hongsheng Li 17 5 0 23 Dec 2020
AutoCaption: Image Captioning with Neural Architecture Search Xinxin Zhu Weining Wang Longteng Guo Jing Liu 24 9 0 16 Dec 2020
Improving Image Captioning by Leveraging Intra- and Inter-layer Global Representation in Transformer Network Jiayi Ji Yunpeng Luo Xiaoshuai Sun Fuhai Chen Gen Luo Yongjian Wu Yue Gao Rongrong Ji ViT 41 170 0 13 Dec 2020
LayoutGMN: Neural Graph Matching for Structural Layout Similarity A. Patil Manyi Li Matthew Fisher Manolis Savva Hao Zhang 25 32 0 11 Dec 2020
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans Dave Zhenyu Chen A. Gholami Matthias Nießner Angel X. Chang 3DPC 20 157 0 03 Dec 2020
Dual Attention on Pyramid Feature Maps for Image Captioning Litao Yu Jian Andrew Zhang Qiang Wu 16 47 0 02 Nov 2020
New Ideas and Trends in Deep Multimodal Content Understanding: A Review Wei-Neng Chen Weiping Wang Li Liu M. Lew VLM 110 31 0 16 Oct 2020
Teacher-Critical Training Strategies for Image Captioning Yiqing Huang Jiansheng Chen VLM 8 8 0 30 Sep 2020
SceneGen: Generative Contextual Scene Augmentation using Scene Graph Priors Mohammad Keshavarzi Aakash Parikh Xiyu Zhai Melody Mao Luisa Caldas A. Yang 19 24 0 25 Sep 2020
Retargetable AR: Context-aware Augmented Reality in Indoor Scenes based on 3D Scene Graph Tomu Tahara Takashi Seno Gaku Narita T. Ishikawa 24 47 0 18 Aug 2020
Sparse Graph to Sequence Learning for Vision Conditioned Long Textual Sequence Generation Aditya Mogadala Marius Mosbach Dietrich Klakow VLM 69 0 0 12 Jul 2020
Dynamic Graph Representation Learning for Video Dialog via Multi-Modal Shuffled Transformers Shijie Geng Peng Gao Moitreya Chatterjee Chiori Hori Jonathan Le Roux Yongfeng Zhang Hongsheng Li A. Cherian 19 11 0 08 Jul 2020
Improving Image Captioning with Better Use of Captions Zhan Shi Xu Zhou Xipeng Qiu Xiao-Dan Zhu 22 121 0 21 Jun 2020
Character Matters: Video Story Understanding with Character-Aware Relations Shijie Geng Ji Zhang Zuohui Fu Peng Gao Hang Zhang Gerard de Melo 18 11 0 09 May 2020
Better Captioning with Sequence-Level Exploration Jia Chen Qin Jin 29 12 0 08 Mar 2020
Show, Edit and Tell: A Framework for Editing Image Captions Fawaz Sammani Luke Melas-Kyriazi KELM DiffM 43 59 0 06 Mar 2020
Unbiased Scene Graph Generation from Biased Training Kaihua Tang Yulei Niu Jianqiang Huang Jiaxin Shi Hanwang Zhang CML 22 680 0 27 Feb 2020
Object Relational Graph with Teacher-Recommended Learning for Video Captioning Ziqi Zhang Yaya Shi Chunfen Yuan Bing Li Peijin Wang Weiming Hu Zhengjun Zha VLM 18 271 0 26 Feb 2020
Meshed-Memory Transformer for Image Captioning Marcella Cornia Matteo Stefanini Lorenzo Baraldi Rita Cucchiara 14 868 0 17 Dec 2019
Fast Image Caption Generation with Position Alignment Z. Fei 18 37 0 13 Dec 2019
Learning Visual Relation Priors for Image-Text Matching and Image Captioning with Neural Scene Graph Generators Kuang-Huei Lee Hamid Palangi Xi Chen Houdong Hu Jianfeng Gao VLM 19 37 0 22 Sep 2019
Relation Distillation Networks for Video Object Detection Jiajun Deng Yingwei Pan Ting Yao Wen-gang Zhou Houqiang Li Tao Mei ObjD 95 191 0 26 Aug 2019
Attention on Attention for Image Captioning Lun Huang Wenmin Wang Jie Chen Xiao-Yong Wei 22 823 0 19 Aug 2019
Aligning Linguistic Words and Visual Semantic Units for Image Captioning Longteng Guo Jing Liu Jinhui Tang Jiangwei Li W. Luo Hanqing Lu 11 102 0 06 Aug 2019
Convolutional Auto-encoding of Sentence Topics for Image Paragraph Generation Jing Wang Yingwei Pan Ting Yao Jinhui Tang Tao Mei VLM BDL DiffM 14 36 0 01 Aug 2019
An Empirical Study on Leveraging Scene Graphs for Visual Question Answering Cheng Zhang Wei-Lun Chao D. Xuan 23 50 0 28 Jul 2019
Graph Neural Lasso for Dynamic Network Regression Yixin Chen Lin Meng Jiawei Zhang AI4TS 14 5 0 25 Jul 2019
Image Captioning: Transforming Objects into Words Simão Herdade Armin Kappeler K. Boakye Joao Soares ViT 17 462 0 14 Jun 2019
Relational Reasoning using Prior Knowledge for Visual Captioning Jingyi Hou Xinxiao Wu Yayun Qi Wentian Zhao Jiebo Luo Yunde Jia 17 14 0 04 Jun 2019
Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image Representations Fenglin Liu Yuanxin Liu Xuancheng Ren Xiaodong He Xu Sun VLM 26 81 0 15 May 2019
Temporal Deformable Convolutional Encoder-Decoder Networks for Video Captioning Jingwen Chen Yingwei Pan Yehao Li Ting Yao Hongyang Chao Tao Mei 17 104 0 03 May 2019
Meta-Sim: Learning to Generate Synthetic Datasets Amlan Kar Aayush Prakash Ming-Yu Liu Eric Cameracci Justin Yuan Matt Rusiniak David Acuna Antonio Torralba Sanja Fidler 8 247 0 25 Apr 2019
Pointing Novel Objects in Image Captioning Yehao Li Ting Yao Yingwei Pan Hongyang Chao Tao Mei 25 69 0 25 Apr 2019
Exploring Object Relation in Mean Teacher for Cross-Domain Detection Qi Cai Yingwei Pan Chong-Wah Ngo Xinmei Tian Ling-yu Duan Ting Yao ViT OOD 10 306 0 25 Apr 2019