v1v2 (latest)

Overcoming Language Priors in Visual Question Answering with Adversarial Regularization

8 October 2018

Papers citing "Overcoming Language Priors in Visual Question Answering with Adversarial Regularization"

50 / 138 papers shown

QLEVR: A Diagnostic Dataset for Quantificational Language and Elementary Visual Reasoning

Zechen Li

Anders Søgaard

142

06 May 2022

Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks

...

Jianwei Yang

Lu Yuan

260

22 Apr 2022

OccamNets: Mitigating Dataset Bias by Favoring Simpler HypothesesEuropean Conference on Computer Vision (ECCV), 2022

344

05 Apr 2022

SwapMix: Diagnosing and Regularizing the Over-Reliance on Visual Context in Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

175

05 Apr 2022

A Closer Look at Debiased Temporal Sentence Grounding in Videos: Dataset, Metric, and Approach

181

10 Mar 2022

On Modality Bias Recognition and Reduction

279

25 Feb 2022

Webly Supervised Concept Expansion for General Purpose Vision ModelsEuropean Conference on Computer Vision (ECCV), 2022

295

04 Feb 2022

Grounding Answers for Visual Questions Asked by Visually Impaired PeopleComputer Vision and Pattern Recognition (CVPR), 2022

Chongyan Chen

Samreen Anjum

Danna Gurari

286

04 Feb 2022

Language-biased image classification: evaluation based on semantic representationsInternational Conference on Learning Representations (ICLR), 2022

Yoann Lemesle

Masataka Sawayama

Guillermo Valle Pérez

130

26 Jan 2022

Improving the fusion of acoustic and text representations in RNN-TIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Chao Zhang

196

25 Jan 2022

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks

Jianwei Yang

Lu Yuan

210

15 Jan 2022

Learning Sample Importance for Cross-Scenario Video Temporal GroundingInternational Conference on Multimedia Retrieval (ICMR), 2022

P. Bao

Yadong Mu

153

08 Jan 2022

General Greedy De-bias LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

480

20 Dec 2021

Medical Visual Question Answering: A Survey

Danli Shi

Qi Wu

320

178

19 Nov 2021

Language bias in Visual Question Answering: A Survey and Taxonomy

Desen Yuan

225

16 Nov 2021

Towards Debiasing Temporal Sentence Grounding in Video

197

08 Nov 2021

Introspective Distillation for Robust Question AnsweringNeural Information Processing Systems (NeurIPS), 2021

Yulei Niu

Hanwang Zhang

262

01 Nov 2021

Perceptual Score: What Data Modalities Does Your Model Perceive?

Itai Gat

Idan Schwartz

Alex Schwing

207

27 Oct 2021

Review-Based Domain Disentanglement without Duplicate Users or Contexts for Cross-Domain RecommendationInternational Conference on Information and Knowledge Management (CIKM), 2021

243

25 Oct 2021

Counterfactual Samples Synthesizing and Training for Robust Visual Question Answering

Hanwang Zhang

283

03 Oct 2021

Calibrating Concepts and Operations: Towards Symbolic Reasoning on Real Images

Elias Stengel-Eskin

Cihang Xie

153

01 Oct 2021

Raising context awareness in motion forecasting

327

16 Sep 2021

Discovering the Unknown Knowns: Turning Implicit Knowledge in the Dataset into Explicit Training Examples for Visual Question Answering

Jihyung Kil

Cheng Zhang

D. Xuan

Wei-Lun Chao

264

13 Sep 2021

On the Significance of Question Encoder Sequence Model in the Out-of-Distribution Performance in Visual Question Answering

K. Gouthaman

Anurag Mittal

CML

227

28 Aug 2021

Greedy Gradient Ensemble for Robust Visual Question AnsweringIEEE International Conference on Computer Vision (ICCV), 2021

238

27 Jul 2021

Neural Abstructions: Abstractions that Support Construction for Grounded Language Learning

Kaylee Burns

Christopher D. Manning

Li Fei-Fei

178

20 Jul 2021

Separating Skills and Concepts for Novel Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2021

Heng Ji

185

19 Jul 2021

Check It Again: Progressive Visual Question Answering via Visual EntailmentAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Zheng Lin

151

08 Jun 2021

LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question AnsweringAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2021

Zujie Liang

Haifeng Hu

Jiaying Zhu

203

29 May 2021

AdaVQA: Overcoming Language Priors with Adapted Margin Cosine LossInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Ji Zhang

144

05 May 2021

Worst of Both Worlds: Biases Compound in Pre-trained Vision-and-Language Models

Tejas Srinivasan

Yonatan Bisk

VLM

309

18 Apr 2021

Beyond Question-Based Biases: Assessing Multimodal Shortcut Learning in Visual Question AnsweringIEEE International Conference on Computer Vision (ICCV), 2021

331

07 Apr 2021

Improved and efficient inter-vehicle distance estimation using road gradients of both ego and target vehiclesInternational Conference on Autonomic and Autonomous Systems (ICAAS), 2021

Robik Shrestha

Jinkyu Lee

Kushal Kafle

S. Hwang

Il Yong Chun

152

01 Apr 2021

Domain-robust VQA with diverse datasets and methods but no target labelsComputer Vision and Pattern Recognition (CVPR), 2021

300

29 Mar 2021

Detecting Spurious Correlations with Sanity Tests for Artificial Intelligence Guided Radiology SystemsFrontiers in Digital Health (FDH), 2021

189

04 Mar 2021

Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual ConceptsComputer Vision and Pattern Recognition (CVPR), 2021

1.2K

1,368

17 Feb 2021

Answer Questions with Right Image Regions: A Visual Attention Regularization Approach

189

03 Feb 2021

Mitigating the Position Bias of Transformer Models in Passage Re-RankingEuropean Conference on Information Retrieval (ECIR), 2021

310

18 Jan 2021

Explainability of deep vision-based autonomous driving systems: Review and challengesInternational Journal of Computer Vision (IJCV), 2021

481

206

13 Jan 2021

Object-Centric Diagnosis of Visual Reasoning

Jianwei Yang

Jiayuan Mao

Jiajun Wu

Devi Parikh

David D. Cox

J. Tenenbaum

Chuang Gan

OCL

193

21 Dec 2020

Learning content and context with language bias for Visual Question AnsweringIEEE International Conference on Multimedia and Expo (ICME), 2020

156

21 Dec 2020

Trying Bilinear Pooling in Video-QA

T. Winterbottom

S. Xiao

A. McLean

Noura Al Moubayed

209

18 Dec 2020

On Modality Bias in the TVQA DatasetBritish Machine Vision Conference (BMVC), 2020

T. Winterbottom

S. Xiao

A. McLean

Noura Al Moubayed

174

18 Dec 2020

Overcoming Language Priors with Self-supervised Learning for Visual Question AnsweringInternational Joint Conference on Artificial Intelligence (IJCAI), 2020

172

132

17 Dec 2020

Loss re-scaling VQA: Revisiting the LanguagePrior Problem from a Class-imbalance ViewIEEE Transactions on Image Processing (TIP), 2020

Min Zhang

362

30 Oct 2020

Removing Bias in Multi-modal Classifiers: Regularization by Maximizing Functional EntropiesNeural Information Processing Systems (NeurIPS), 2020

261

100

21 Oct 2020

SOrT-ing VQA Models : Contrastive Gradient Learning for Improved ConsistencyNorth American Chapter of the Association for Computational Linguistics (NAACL), 2020

Sameer Dharur

Purva Tendulkar

Dhruv Batra

Devi Parikh

Ramprasaath R. Selvaraju

162

20 Oct 2020

Multimodal Research in Vision and Language: A Review of Current and Emerging Trends

Roger Zimmermann

279

19 Oct 2020

Multimodal Speech Recognition with Unstructured Audio Masking

120

16 Oct 2020

Counterfactual Variable Control for Robust and Interpretable Question Answering

261

12 Oct 2020