Learning to Count Objects in Natural Images for Visual Question
Answering

Learning to Count Objects in Natural Images for Visual Question Answering

15 February 2018

Jonathon S. Hare

Adam Prugel-Bennett

Papers citing "Learning to Count Objects in Natural Images for Visual Question Answering"

16 / 16 papers shown

Title
Understanding and Mitigating Classification Errors Through Interpretable Token Patterns Michael A. Hedderich Jonas Fischer Dietrich Klakow Jilles Vreeken 11 0 0 18 Nov 2023
MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question Answering Yang Ding Jing Yu Bangchang Liu Yue Hu Mingxin Cui Qi Wu 8 61 0 17 Mar 2022
Detecting Human-Object Interactions with Object-Guided Cross-Modal Calibrated Semantics Hangjie Yuan Mang Wang Dong Ni Liangpeng Xu 4 36 0 01 Feb 2022
SA-VQA: Structured Alignment of Visual and Semantic Representations for Visual Question Answering Peixi Xiong Quanzeng You Pei Yu Zicheng Liu Ying Wu 10 5 0 25 Jan 2022
Bilateral Cross-Modality Graph Matching Attention for Feature Fusion in Visual Question Answering Jianjian Cao Xiameng Qin Sanyuan Zhao Jianbing Shen 23 20 0 14 Dec 2021
VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question Answering Ekta Sood Fabian Kögel Florian Strohm Prajit Dhar Andreas Bulling 24 19 0 27 Sep 2021
BGT-Net: Bidirectional GRU Transformer Network for Scene Graph Generation Naina Dhingra Florian Ritter A. Kunz 73 37 0 11 Sep 2021
Causal Attention for Vision-Language Tasks Xu Yang Hanwang Zhang Guojun Qi Jianfei Cai CML 23 147 0 05 Mar 2021
Open Set Domain Adaptation by Extreme Value Theory Yiming Xu Diego Klabjan VLM 29 3 0 22 Dec 2020
Accuracy vs. Complexity: A Trade-off in Visual Question Answering Models M. Farazi Salman H. Khan Nick Barnes 21 17 0 20 Jan 2020
Probabilistic framework for solving Visual Dialog Badri N. Patro Anupriy Vinay P. Namboodiri BDL 22 13 0 11 Sep 2019
U-CAM: Visual Explanation using Uncertainty based Class Activation Maps Badri N. Patro Mayank Lunayach Shivansh Patel Vinay P. Namboodiri FAtt UQCV 16 76 0 17 Aug 2019
Auto-Encoding Scene Graphs for Image Captioning Xu Yang Kaihua Tang Hanwang Zhang Jianfei Cai 8 692 0 06 Dec 2018
Counterfactual Critic Multi-Agent Training for Scene Graph Generation Long Chen Hanwang Zhang Jun Xiao Xiangnan He Shiliang Pu Shih-Fu Chang 14 159 0 06 Dec 2018
Explainable and Explicit Visual Reasoning over Scene Graphs Jiaxin Shi Hanwang Zhang Juan-Zi Li OCL 155 230 0 05 Dec 2018
Transparency by Design: Closing the Gap Between Performance and Interpretability in Visual Reasoning David Mascharka Philip Tran Ryan Soklaski Arjun Majumdar 20 207 0 14 Mar 2018