Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering

2 December 2016

Devi Parikh

Papers citing "Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering"

50 / 1,956 papers shown

Title
Generalized Hadamard-Product Fusion Operators for Visual Question Answering Brendan Duke Graham W. Taylor 17 8 0 26 Mar 2018
Attention on Attention: Architectures for Visual Question Answering (VQA) Jasdeep Singh Vincent Ying Alex Nutkiewicz 6 26 0 21 Mar 2018
VQA-E: Explaining, Elaborating, and Enhancing Your Answers for Visual Questions Qing Li Qingyi Tao Shafiq R. Joty Jianfei Cai Jiebo Luo 22 105 0 20 Mar 2018
Inverse Visual Question Answering: A New Benchmark and VQA Diagnosis Tool Feng Liu Tao Xiang Timothy M. Hospedales Wankou Yang Changyin Sun 6 29 0 16 Mar 2018
Annotation Artifacts in Natural Language Inference Data Suchin Gururangan Swabha Swayamdipta Omer Levy Roy Schwartz Samuel R. Bowman Noah A. Smith 26 1,155 0 06 Mar 2018
VizWiz Grand Challenge: Answering Visual Questions from Blind People Danna Gurari Qing Li Abigale Stangl Anhong Guo Chi Lin Kristen Grauman Jiebo Luo Jeffrey P. Bigham CoGe 18 799 0 22 Feb 2018
Learning to Count Objects in Natural Images for Visual Question Answering Yan Zhang Jonathon S. Hare Adam Prugel-Bennett OOD 16 205 0 15 Feb 2018
Multimodal Explanations: Justifying Decisions and Pointing to the Evidence Dong Huk Park Lisa Anne Hendricks Zeynep Akata Anna Rohrbach Bernt Schiele Trevor Darrell Marcus Rohrbach 35 418 0 15 Feb 2018
Dual Recurrent Attention Units for Visual Question Answering Ahmed Osman Wojciech Samek 28 30 0 01 Feb 2018
Object-based reasoning in VQA Mikyas T. Desta Larry Chen Tomasz Kornuta 16 33 0 29 Jan 2018
Tell-and-Answer: Towards Explainable Visual Question Answering using Attributes and Captions Qing Li Jianlong Fu D. Yu Tao Mei Jiebo Luo FAtt XAI CoGe 41 60 0 27 Jan 2018
DVQA: Understanding Data Visualizations via Question Answering Kushal Kafle Brian L. Price Scott D. Cohen Christopher Kanan AIMat 24 360 0 24 Jan 2018
Structured Triplet Learning with POS-tag Guided Attention for Visual Question Answering Zhe Wang Xiaoyi Liu Liangjian Chen Limin Wang Yu Qiao Xiaohui Xie Charless C. Fowlkes 8 14 0 24 Jan 2018
What do we need to build explainable AI systems for the medical domain? Andreas Holzinger Chris Biemann C. Pattichis D. Kell 11 679 0 28 Dec 2017
Interpretable Counting for Visual Question Answering Alexander R. Trott Caiming Xiong R. Socher 14 70 0 23 Dec 2017
CoDraw: Collaborative Drawing as a Testbed for Grounded Goal-driven Communication Jin-Hwa Kim Nikita Kitaev Xinlei Chen Marcus Rohrbach Byoung-Tak Zhang Yuandong Tian Dhruv Batra Devi Parikh DiffM VGen 22 25 0 15 Dec 2017
IQA: Visual Question Answering in Interactive Environments Daniel Gordon Aniruddha Kembhavi Mohammad Rastegari Joseph Redmon D. Fox Ali Farhadi LM&Ro 14 384 0 09 Dec 2017
Don't Just Assume; Look and Answer: Overcoming Priors for Visual Question Answering Aishwarya Agrawal Dhruv Batra Devi Parikh Aniruddha Kembhavi OOD 51 581 0 01 Dec 2017
Embodied Question Answering Abhishek Das Samyak Datta Georgia Gkioxari Stefan Lee Devi Parikh Dhruv Batra LM&Ro 27 639 0 30 Nov 2017
Visual Question Answering as a Meta Learning Task Damien Teney A. Hengel OOD 27 42 0 22 Nov 2017
Vision-and-Language Navigation: Interpreting visually-grounded navigation instructions in real environments Peter Anderson Qi Wu Damien Teney Jake Bruce Mark Johnson Niko Sünderhauf Ian Reid Stephen Gould A. Hengel LM&Ro 19 1,281 0 20 Nov 2017
A Novel Framework for Robustness Analysis of Visual QA Models Jia-Hong Huang Cuong Duc Dao Modar Alfadly Bernard Ghanem AAML OOD 11 34 0 16 Nov 2017
Active Learning for Visual Question Answering: An Empirical Study Xiaoyu Lin Devi Parikh 23 31 0 06 Nov 2017
Whodunnit? Crime Drama as a Case for Natural Language Understanding Lea Frermann Shay B. Cohen Mirella Lapata 25 26 0 31 Oct 2017
FigureQA: An Annotated Figure Dataset for Visual Reasoning Samira Ebrahimi Kahou Vincent Michalski Adam Atkinson Ákos Kádár Adam Trischler Yoshua Bengio ReLM AIMat 16 304 0 19 Oct 2017
iVQA: Inverse Visual Question Answering Feng Liu Tao Xiang Timothy M. Hospedales Wankou Yang Changyin Sun 20 47 0 10 Oct 2017
Fooling Vision and Language Models Despite Localization and Attention Mechanism Xiaojun Xu Xinyun Chen Chang-rui Liu Anna Rohrbach Trevor Darrell D. Song AAML 6 41 0 25 Sep 2017
Survey of Recent Advances in Visual Question Answering Supriya Pandhre Shagun Sodhani 6 14 0 24 Sep 2017
Visual Reference Resolution using Attention Memory for Visual Dialog Paul Hongsuck Seo Andreas M. Lehrmann Bohyung Han Leonid Sigal 23 122 0 23 Sep 2017
FiLM: Visual Reasoning with a General Conditioning Layer Ethan Perez Florian Strub H. D. Vries Vincent Dumoulin Aaron Courville FAtt AIMat OffRL AI4CE 23 2,135 0 22 Sep 2017
Visual Question Generation as Dual Task of Visual Question Answering Yikang Li Nan Duan Bolei Zhou Xiao Chu Wanli Ouyang Xiaogang Wang 24 165 0 21 Sep 2017
Beyond Bilinear: Generalized Multimodal Factorized High-order Pooling for Visual Question Answering Zhou Yu Jun-chen Yu Chenchao Xiang Jianping Fan Dacheng Tao 12 457 0 10 Aug 2017
Learning to Disambiguate by Asking Discriminative Questions Yining Li Chen Huang Xiaoou Tang Chen Change Loy 16 22 0 09 Aug 2017
Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge Damien Teney Peter Anderson Xiaodong He A. Hengel 45 380 0 09 Aug 2017
A Simple Loss Function for Improving the Convergence and Accuracy of Visual Question Answering Models Ilija Ilievski Jiashi Feng 17 11 0 02 Aug 2017
Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering Peter Anderson Xiaodong He Chris Buehler Damien Teney Mark Johnson Stephen Gould Lei Zhang AIMat 25 4,177 0 25 Jul 2017
Visual Question Answering with Memory-Augmented Networks Chao Ma Chunhua Shen A. Dick Qi Wu Peng Wang A. Hengel Ian Reid 12 98 0 17 Jul 2017
Learning Visual Reasoning Without Strong Priors Ethan Perez H. D. Vries Florian Strub Vincent Dumoulin Aaron Courville OOD NAI 26 62 0 10 Jul 2017
Modulating early visual processing by language H. D. Vries Florian Strub Jérémie Mary Hugo Larochelle Olivier Pietquin Aaron Courville 29 482 0 02 Jul 2017
Deep learning evaluation using deep linguistic processing A. Kuhnle Ann A. Copestake ELM 23 11 0 05 Jun 2017
Attention-based Natural Language Person Retrieval Tao Zhou Muhao Chen Jie Yu Demetri Terzopoulos 17 14 0 24 May 2017
Inferring and Executing Programs for Visual Reasoning Justin Johnson B. Hariharan L. V. D. van der Maaten Judy Hoffman Li Fei-Fei C. L. Zitnick Ross B. Girshick NAI 19 540 0 10 May 2017
FOIL it! Find One mismatch between Image and Language caption Ravi Shekhar Sandro Pezzelle Yauhen Klimovich Aurélie Herbelot Moin Nabi E. Sangineto Raffaella Bernardi 6 137 0 03 May 2017
Speech-Based Visual Question Answering Ted Zhang Dengxin Dai Tinne Tuytelaars Marie-Francine Moens Luc Van Gool 22 24 0 01 May 2017
C-VQA: A Compositional Split of the Visual Question Answering (VQA) v1.0 Dataset Aishwarya Agrawal Aniruddha Kembhavi Dhruv Batra Devi Parikh CoGe 11 80 0 26 Apr 2017
Being Negative but Constructively: Lessons Learnt from Creating Better Visual Question Answering Datasets Wei-Lun Chao Hexiang Hu Fei Sha 22 37 0 24 Apr 2017
Learning to Reason: End-to-End Module Networks for Visual Question Answering Ronghang Hu Jacob Andreas Marcus Rohrbach Trevor Darrell Kate Saenko KELM GNN ReLM LRM 29 573 0 18 Apr 2017
ShapeWorld - A new test methodology for multimodal language understanding A. Kuhnle Ann A. Copestake 24 66 0 14 Apr 2017
TGIF-QA: Toward Spatio-Temporal Reasoning in Visual Question Answering Y. Jang Yale Song Youngjae Yu Youngjin Kim Gunhee Kim 12 544 0 14 Apr 2017
Show, Ask, Attend, and Answer: A Strong Baseline For Visual Question Answering V. Kazemi Ali Elqursh OOD 22 183 0 11 Apr 2017