v1v2v3 (latest)

Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering

2 December 2016

Devi Parikh

Papers citing "Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering"

50 / 2,278 papers shown

Question Relevance in Visual Question Answering

Prakruthi Prabhakar

Nitish Kulkarni

Linghao Zhang

106

23 Jul 2018

Dynamic Multimodal Instance Segmentation guided by natural language queriesEuropean Conference on Computer Vision (ECCV), 2018

263

188

06 Jul 2018

Collaborative Annotation of Semantic Objects in Images with Multi-granularity SupervisionsACM Multimedia (ACM MM), 2018

Lishi Zhang

Chenghan Fu

Jia Li

110

27 Jun 2018

End-to-End Audio Visual Scene-Aware Dialog using Multimodal Attention-Based Video Features

...

Raphael Gontijo-Lopes

Devi Parikh

208

130

21 Jun 2018

Learning Conditioned Graph Structures for Interpretable Visual Question Answering

390

252

19 Jun 2018

Learning Visual Knowledge Memory Networks for Visual Question Answering

Yinpeng Dong

176

13 Jun 2018

Cross-Dataset Adaptation for Visual Question Answering

Wei-Lun Chao

Hexiang Hu

Fei Sha

OOD

157

10 Jun 2018

Learning Answer Embeddings for Visual Question Answering

Hexiang Hu

Wei-Lun Chao

Fei Sha

107

10 Jun 2018

CS-VQA: Visual Question Answering with Compressively Sensed Images

Suhas Lohit

154

08 Jun 2018

Visual Reasoning by Progressive Module Networks

Seung Wook Kim

Makarand Tapaswi

Sanja Fidler

ReLM LRM

189

06 Jun 2018

Focal Visual-Text Attention for Visual Question Answering

Alexander G. Hauptmann

164

114

05 Jun 2018

On the Flip Side: Identifying Counterexamples in Visual Question Answering

179

03 Jun 2018

Visual Referring Expression Recognition: What Do Systems Actually Learn?

Volkan Cirik

Louis-Philippe Morency

Taylor Berg-Kirkpatrick

130

30 May 2018

Joint Image Captioning and Question Answering

Jialin Wu

Zeyuan Hu

Raymond J. Mooney

113

22 May 2018

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Shagun Sodhani

Vardaan Pahuja

21 May 2018

A new dataset and model for learning to understand navigational instructions

Ozan Arkan Can

Deniz Yuret

164

21 May 2018

Bilinear Attention Networks

483

993

21 May 2018

Did the Model Understand the Question?

Pramod Kaushik Mudrakarta

Ankur Taly

Mukund Sundararajan

Kedar Dhamdhere

ELM OOD FAtt

154

203

14 May 2018

Reciprocal Attention Fusion for Visual Question Answering

M. Farazi

Salman H Khan

181

11 May 2018

Question Type Guided Attention in Visual Question Answering

Yang Shi

Tommaso Furlanello

Sheng Zha

Anima Anandkumar

159

06 Apr 2018

Improved Fusion of Visual and Language Representations by Dense Symmetric Co-Attention for Visual Question Answering

Duy-Kien Nguyen

Takayuki Okatani

231

296

03 Apr 2018

Differential Attention for Visual Question Answering

Badri N. Patro

Vinay P. Namboodiri

AIMat

153

01 Apr 2018

Visual Question Reasoning on General Dependency Tree

Xiaodan Liang

195

31 Mar 2018

Generalized Hadamard-Product Fusion Operators for Visual Question Answering

Brendan Duke

Graham W. Taylor

111

26 Mar 2018

Attention on Attention: Architectures for Visual Question Answering (VQA)

Jasdeep Singh

Vincent Ying

Alex Nutkiewicz

105

21 Mar 2018

VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions

Jianfei Cai

266

115

20 Mar 2018

Inverse Visual Question Answering: A New Benchmark and VQA Diagnosis ToolIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2018

Feng Liu

Tao Xiang

Timothy M. Hospedales

Wankou Yang

Changyin Sun

185

16 Mar 2018

Annotation Artifacts in Natural Language Inference Data

421

1,229

06 Mar 2018

VizWiz Grand Challenge: Answering Visual Questions from Blind People

684

1,071

22 Feb 2018

Learning to Count Objects in Natural Images for Visual Question Answering

218

217

15 Feb 2018

Multimodal Explanations: Justifying Decisions and Pointing to the Evidence

Bernt Schiele

225

452

15 Feb 2018

Dual Recurrent Attention Units for Visual Question Answering

Ahmed Osman

Wojciech Samek

226

01 Feb 2018

Object-based reasoning in VQA

Mikyas T. Desta

Larry Chen

Tomasz Kornuta

194

29 Jan 2018

Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions

Tao Mei

140

27 Jan 2018

DVQA: Understanding Data Visualizations via Question Answering

358

474

24 Jan 2018

Structured Triplet Learning with POS-tag Guided Attention for Visual Question Answering

Zhe Wang

Yu Qiao

147

24 Jan 2018

What do we need to build explainable AI systems for the medical domain?

209

801

28 Dec 2017

Interpretable Counting for Visual Question AnsweringInternational Conference on Learning Representations (ICLR), 2017

Alexander R. Trott

Caiming Xiong

R. Socher

225

23 Dec 2017

CoDraw: Collaborative Drawing as a Testbed for Grounded Goal-driven Communication

Devi Parikh

173

15 Dec 2017

IQA: Visual Question Answering in Interactive Environments

393

418

09 Dec 2017

Don't Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering

Devi Parikh

498

644

01 Dec 2017

Embodied Question Answering

Devi Parikh

352

713

30 Nov 2017

Visual Question Answering as a Meta Learning Task

Damien Teney

Anton Van Den Hengel

OOD

151

22 Nov 2017

Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments

Qi Wu

932

1,549

20 Nov 2017

A Novel Framework for Robustness Analysis of Visual QA Models

266

16 Nov 2017

Active Learning for Visual Question Answering: An Empirical Study

Xiaoyu Lin

Devi Parikh

194

06 Nov 2017

Whodunnit? Crime Drama as a Case for Natural Language Understanding

Lea Frermann

Shay B. Cohen

Mirella Lapata

104

31 Oct 2017

FigureQA: An Annotated Figure Dataset for Visual Reasoning

Samira Ebrahimi Kahou

235

407

19 Oct 2017

iVQA: Inverse Visual Question Answering

Feng Liu

Tao Xiang

Timothy M. Hospedales

Wankou Yang

Changyin Sun

148

10 Oct 2017

Fooling Vision and Language Models Despite Localization and Attention Mechanism

228

25 Sep 2017