Cycle-Consistency for Robust Visual Question Answering

15 February 2019

Devi Parikh

Papers citing "Cycle-Consistency for Robust Visual Question Answering"

50 / 129 papers shown

ULN: Towards Underspecified Vision-and-Language NavigationConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

290

18 Oct 2022

Selecting Better Samples from Pre-trained LLMs: A Case Study on Question GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

260

22 Sep 2022

A Survey of Deep Causal Models and Their Industrial ApplicationsArtificial Intelligence Review (Artif Intell Rev), 2022

553

19 Sep 2022

Correlation Information Bottleneck: Towards Adapting Pretrained Multimodal Models for Robust Visual Question AnsweringInternational Journal of Computer Vision (IJCV), 2022

Jingjing Jiang

Zi-yi Liu

Nanning Zheng

364

14 Sep 2022

Hierarchical Local-Global Transformer for Temporal Sentence GroundingIEEE transactions on multimedia (IEEE TMM), 2022

234

31 Aug 2022

A Feature-space Multimodal Data Augmentation Technique for Text-video RetrievalACM Multimedia (ACM MM), 2022

203

03 Aug 2022

TAG: Boosting Text-VQA via Text-aware Visual Question-answer GenerationBritish Machine Vision Conference (BMVC), 2022

Jun Wang

M. Gao

Yuqian Hu

Ramprasaath R. Selvaraju

Ran Xu

217

03 Aug 2022

Consistency-preserving Visual Question Answering in Medical ImagingInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2022

Sergio Tascon-Morales

Pablo Márquez-Neila

Raphael Sznitman

MedIm

180

27 Jun 2022

Towards Adversarial Attack on Vision-Language Pre-training ModelsACM Multimedia (ACM MM), 2022

297

148

19 Jun 2022

Toward Learning Robust and Invariant Representations with Alignment Regularization and Data AugmentationKnowledge Discovery and Data Mining (KDD), 2022

126

04 Jun 2022

Learning to Answer Visual Questions from Web VideosIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

314

10 May 2022

All You May Need for VQA are Image CaptionsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

259

04 May 2022

Reliable Visual Question Answering: Abstain Rather Than Answer IncorrectlyEuropean Conference on Computer Vision (ECCV), 2022

349

28 Apr 2022

Multimodal Adaptive Distillation for Leveraging Unimodal Encoders for Vision-Language Tasks

...

Jianwei Yang

Lu Yuan

260

22 Apr 2022

Measuring Compositional Consistency for Video Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

Mona Gandhi

Mustafa Omer Gul

Eva Prakash

Madeleine Grunde-McLaughlin

Ranjay Krishna

Maneesh Agrawala

CoGe

208

14 Apr 2022

Counterfactual Cycle-Consistent Learning for Instruction Following and Generation in Vision-Language NavigationComputer Vision and Pattern Recognition (CVPR), 2022

Luc Van Gool

209

30 Mar 2022

CARETS: A Consistency And Robustness Evaluative Test Suite for VQAAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

156

15 Mar 2022

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks

Jianwei Yang

Lu Yuan

209

15 Jan 2022

MLP Architectures for Vision-and-Language Modeling: An Empirical Study

Zicheng Liu

149

08 Dec 2021

Robustness through Data Augmentation Loss Consistency

383

21 Oct 2021

Breaking the Dilemma of Medical Image-to-image Translation

369

182

13 Oct 2021

Counterfactual Samples Synthesizing and Training for Robust Visual Question Answering

Hanwang Zhang

275

03 Oct 2021

Multimodal Integration of Human-Like Attention in Visual Question Answering

166

27 Sep 2021

VQA-MHUG: A Gaze Dataset to Study Multimodal Neural Attention in Visual Question AnsweringConference on Computational Natural Language Learning (CoNLL), 2021

169

27 Sep 2021

Discovering the Unknown Knowns: Turning Implicit Knowledge in the Dataset into Explicit Training Examples for Visual Question Answering

Jihyung Kil

Cheng Zhang

D. Xuan

Wei-Lun Chao

264

13 Sep 2021

Pulling Up by the Causal Bootstraps: Causal Data Augmentation for Pre-training DebiasingInternational Conference on Information and Knowledge Management (CIKM), 2021

166

27 Aug 2021

BiaSwap: Removing dataset bias with bias-tailored swapping augmentationIEEE International Conference on Computer Vision (ICCV), 2021

Eungyeup Kim

Jihyeon Janel Lee

Jaegul Choo

222

23 Aug 2021

Separating Skills and Concepts for Novel Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2021

Heng Ji

179

19 Jul 2021

The Spotlight: A General Method for Discovering Systematic Errors in Deep Learning Models

174

01 Jul 2021

Are VQA Systems RAD? Measuring Robustness to Augmented Data with Focused InterventionsAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

263

08 Jun 2021

Human-Adversarial Visual Question AnsweringNeural Information Processing Systems (NeurIPS), 2021

Sasha Sheng

Amanpreet Singh

Vedanuj Goswami

Jose Alberto Lopez Magana

Wojciech Galuba

Devi Parikh

Douwe Kiela

OOD EgoV AAML

118

04 Jun 2021

Adversarial VQA: A New Benchmark for Evaluating the Robustness of VQA ModelsIEEE International Conference on Computer Vision (ICCV), 2021

288

01 Jun 2021

LPF: A Language-Prior Feedback Objective Function for De-biased Visual Question AnsweringAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2021

Zujie Liang

Haifeng Hu

Jiaying Zhu

203

29 May 2021

Contrastive Fine-tuning Improves Robustness for Neural RankersFindings (Findings), 2021

Xiaofei Ma

Cicero Nogueira dos Santos

Andrew O. Arnold

265

27 May 2021

News Headline Grouping as a Challenging NLU TaskNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

Philippe Laban

Lucas Bandarkar

Marti A. Hearst

147

12 May 2021

Cross-Modal Generative Augmentation for Visual Question AnsweringBritish Machine Vision Conference (BMVC), 2021

Zixu Wang

Yishu Miao

Lucia Specia

208

11 May 2021

gComm: An environment for investigating generalization in Grounded Language Acquisition

Rishi Hazra

Sonu Dixit

176

09 May 2021

Back to Square One: Artifact Detection, Training and Commonsense Disentanglement in the Winograd SchemaConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

307

16 Apr 2021

Beyond Question-Based Biases: Assessing Multimodal Shortcut Learning in Visual Question AnsweringIEEE International Conference on Computer Vision (ICCV), 2021

311

07 Apr 2021

Domain-robust VQA with diverse datasets and methods but no target labelsComputer Vision and Pattern Recognition (CVPR), 2021

278

29 Mar 2021

A Comprehensive Review of the Video-to-Text ProblemArtificial Intelligence Review (AIR), 2021

261

27 Mar 2021

VX2TEXT: End-to-End Learning of Video-Based Text Generation From Multimodal InputsComputer Vision and Pattern Recognition (CVPR), 2021

Gedas Bertasius

Devi Parikh

232

28 Jan 2021

Intrinsically Motivated Compositional Language Emergence

Rishi Hazra

Sonu Dixit

Sayambhu Sen

283

09 Dec 2020

Learning from Lexical Perturbations for Consistent Visual Question Answering

Heng Ji

145

26 Nov 2020

$Squared $\ell_2$ Norm as Consistency Loss for Leveraging Augmented Data to Learn Robust and Invariant Representations$

Squared

\ell_2

Norm as Consistency Loss for Leveraging Augmented Data to Learn Robust and Invariant Representations

145

25 Nov 2020

Logically Consistent Loss for Visual Question Answering

187

19 Nov 2020

An Improved Attention for Visual Question Answering

143

04 Nov 2020

COOT: Cooperative Hierarchical Transformer for Video-Text Representation LearningNeural Information Processing Systems (NeurIPS), 2020

Simon Ging

Mohammadreza Zolfaghari

Hamed Pirsiavash

Thomas Brox

ViT CLIP

200

178

01 Nov 2020

SOrT-ing VQA Models : Contrastive Gradient Learning for Improved ConsistencyNorth American Chapter of the Association for Computational Linguistics (NAACL), 2020

Sameer Dharur

Purva Tendulkar

Dhruv Batra

Devi Parikh

Ramprasaath R. Selvaraju

147

20 Oct 2020

New Ideas and Trends in Deep Multimodal Content Understanding: A ReviewNeurocomputing (Neurocomputing), 2020

329

16 Oct 2020