Overcoming Language Priors with Self-supervised Learning for Visual Question Answering

International Joint Conference on Artificial Intelligence (IJCAI), 2020

17 December 2020

Papers citing "Overcoming Language Priors with Self-supervised Learning for Visual Question Answering"

45 / 45 papers shown

Toward Automatic Safe Driving Instruction: A Large-Scale Vision Language Model Approach

195

28 Nov 2025

Integrating Object Interaction Self-Attention and GAN-Based Debiasing for Visual Question Answering

239

25 Sep 2025

QIRL: Boosting Visual Question Answering via Optimized Question-Image Relation Learning

202

04 Apr 2025

FortisAVQA and MAVEN: a Benchmark Dataset and Debiasing Framework for Robust Multimodal Reasoning

440

01 Apr 2025

Debiasing Multimodal Large Language Models via Noise-Aware Preference OptimizationComputer Vision and Pattern Recognition (CVPR), 2025

377

23 Mar 2025

Overcoming Language Priors for Visual Question Answering Based on Knowledge DistillationIEEE International Conference on Multimedia and Expo (ICME), 2024

Daowan Peng

Wei Wei

935

10 Jan 2025

SAFE-MEME: Structured Reasoning Framework for Robust Hate Speech Detection in Memes

Palash Nandi

Shivam Sharma

Tanmoy Chakraborty

277

31 Dec 2024

CELLO: Causal Evaluation of Large Vision-Language Models

289

27 Jun 2024

MemeMQA: Multimodal Question Answering for Memes via Rationale-Based InferencingAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

297

18 May 2024

Look, Listen, and Answer: Overcoming Biases for Audio-Visual Question Answering

Pinghui Wang

Lingyun Song

654

18 Apr 2024

Mitigating Hallucinations in Large Vision-Language Models with Instruction Contrastive Decoding

Liang Ding

388

180

27 Mar 2024

Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective

574

27 Mar 2024

Debiasing Multimodal Large Language Models via Penalization of Language Priors

467

08 Mar 2024

Improving Data Augmentation for Robust Visual Question Answering with Effective Curriculum LearningInternational Conference on Multimedia Retrieval (ICMR), 2024

Yuhang Zheng

Zhen Wang

Long Chen

257

28 Jan 2024

Object Attribute Matters in Visual Question Answering

Zheng Lin

297

20 Dec 2023

Making the V in Text-VQA Matter

238

01 Aug 2023

Robust Visual Question Answering: Datasets, Methods, and Future ChallengesIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Pinghui Wang

Jun Liu

401

21 Jul 2023

Unveiling Cross Modality Bias in Visual Question Answering: A Causal View with Possible Worlds VQA

250

31 May 2023

MEMEX: Detecting Explanatory Evidence for Memes via Knowledge-Enriched ContextualizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

319

25 May 2023

Meta Neural Coordination

Yuwei Sun

OOD

212

20 May 2023

Visual Question Answering: A Survey on Techniques and Common Trends in Recent Literature

Ana Claudia Akemi Matsuki de Faria

Felype de Castro Bastos

Jose Victor Nogueira Alves da Silva

Vitor Lopes Fabris

Valeska Uchôa

Décio Gonccalves de Aguiar Neto

C. F. G. Santos

372

18 May 2023

An Empirical Study on the Language Modal in Visual Question AnsweringInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

286

17 May 2023

SC-ML: Self-supervised Counterfactual Metric Learning for Debiased Visual Question Answering

219

04 Apr 2023

What do you MEME? Generating Explanations for Visual Semantic Role Labelling in MemesAAAI Conference on Artificial Intelligence (AAAI), 2022

349

01 Dec 2022

Language Prior Is Not the Only Shortcut: A Benchmark for Shortcut Learning in VQAConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Zheng Lin

Jie Zhou

205

10 Oct 2022

Towards Robust Visual Question Answering: Making the Most of Biased Samples via Contrastive LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Zheng Lin

Jie Zhou

312

10 Oct 2022

Overcoming Language Priors in Visual Question Answering via Distinguishing Superficially Similar InstancesInternational Conference on Computational Linguistics (COLING), 2022

Xiaojie Yuan

247

18 Sep 2022

Bidirectional Contrastive Split Learning for Visual Question AnsweringAAAI Conference on Artificial Intelligence (AAAI), 2022

Yuwei Sun

H. Ochiai

363

24 Aug 2022

Generative Bias for Robust Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

In So Kweon

444

01 Aug 2022

Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem

Yan Yan

281

24 Jul 2022

Rethinking Data Augmentation for Robust Visual Question AnsweringEuropean Conference on Computer Vision (ECCV), 2022

297

18 Jul 2022

Visual Commonsense in Pretrained Unimodal and Multimodal ModelsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

Elias Stengel-Eskin

244

04 May 2022

COIN: Counterfactual Image Generation for VQA Interpretation

Zeyd Boukhers

Timo Hartmann

Jan Jurjens

182

10 Jan 2022

Language bias in Visual Question Answering: A Survey and Taxonomy

Desen Yuan

262

16 Nov 2021

Introspective Distillation for Robust Question AnsweringNeural Information Processing Systems (NeurIPS), 2021

Yulei Niu

Hanwang Zhang

338

01 Nov 2021

Counterfactual Samples Synthesizing and Training for Robust Visual Question Answering

Hanwang Zhang

334

03 Oct 2021

Discovering the Unknown Knowns: Turning Implicit Knowledge in the Dataset into Explicit Training Examples for Visual Question Answering

Jihyung Kil

Cheng Zhang

D. Xuan

Wei-Lun Chao

318

13 Sep 2021

X-GGM: Graph Generative Modeling for Out-of-Distribution Generalization in Visual Question AnsweringACM Multimedia (ACM MM), 2021

286

24 Jul 2021

Check It Again: Progressive Visual Question Answering via Visual EntailmentAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Zheng Lin

167

08 Jun 2021

LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question AnsweringAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2021

Zujie Liang

Haifeng Hu

Jiaying Zhu

245

29 May 2021

Cross-Modal Generative Augmentation for Visual Question AnsweringBritish Machine Vision Conference (BMVC), 2021

Zixu Wang

Yishu Miao

Lucia Specia

251

11 May 2021

Answer Questions with Right Image Regions: A Visual Attention Regularization Approach

212

03 Feb 2021

Learning content and context with language bias for Visual Question AnsweringIEEE International Conference on Multimedia and Expo (ICME), 2020

218

21 Dec 2020

Loss re-scaling VQA: Revisiting the LanguagePrior Problem from a Class-imbalance ViewIEEE Transactions on Image Processing (TIP), 2020

Min Zhang

409

30 Oct 2020

Counterfactual VQA: A Cause-Effect Look at Language Bias

624

499

08 Jun 2020