v1v2 (latest)

WeaQA: Weak Supervision via Captions for Visual Question Answering

Findings (Findings), 2020

4 December 2020

Yezhou Yang

Papers citing "WeaQA: Weak Supervision via Captions for Visual Question Answering"

25 / 25 papers shown

SCRA-VQA: Summarized Caption-Rerank for Augmented Large Language Models in Visual Question Answering

136

25 Sep 2025

When Big Models Train Small Ones: Label-Free Model Parity Alignment for Efficient Visual Question Answering using Small VLMs

187

20 Sep 2025

SHAPE : Self-Improved Visual Preference Alignment by Iteratively Generating Holistic Winner

389

06 Mar 2025

MedCoT: Medical Chain of Thought via Hierarchical ExpertConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

601

18 Dec 2024

Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Instructional VideosComputer Vision and Pattern Recognition (CVPR), 2024

506

13 Nov 2024

R-LLaVA: Improving Med-VQA Understanding through Visual Region of Interest

871

27 Oct 2024

Multiscale Matching Driven by Cross-Modal Similarity Consistency for Audio-Text RetrievalIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

Qian Wang

Jia-Chen Gu

Zhen-Hua Ling

275

15 Mar 2024

CIC: A Framework for Culturally-Aware Image Captioning

Youngsik Yun

Jihie Kim

VLM

555

08 Feb 2024

Improving Zero-shot Visual Question Answering via Large Language Models with Reasoning Question PromptsACM Multimedia (ACM MM), 2023

497

15 Nov 2023

Exploring Question Decomposition for Zero-Shot VQANeural Information Processing Systems (NeurIPS), 2023

261

25 Oct 2023

Tackling VQA with Pretrained Foundation Models without Further Training

Alvin De Jun Tan

Bingquan Shen

MLLM

239

27 Sep 2023

Towards Addressing the Misalignment of Object Proposal Evaluation for Vision-Language Tasks via Semantic GroundingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Joshua Forster Feinglass

Yezhou Yang

239

01 Sep 2023

Weakly Supervised Visual Question Answer Generation

217

11 Jun 2023

Q: How to Specialize Large Vision-Language Models to Data-Scarce VQA Tasks? A: Self-Train on Unlabeled Images!Computer Vision and Pattern Recognition (CVPR), 2023

340

06 Jun 2023

From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language ModelsComputer Vision and Pattern Recognition (CVPR), 2022

560

174

21 Dec 2022

Plug-and-Play VQA: Zero-shot VQA by Conjoining Large Pretrained Models with Zero TrainingConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Silvio Savarese

321

140

17 Oct 2022

MaXM: Towards Multilingual Visual Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

318

12 Sep 2022

Learning to Answer Visual Questions from Web VideosIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

431

10 May 2022

All You May Need for VQA are Image CaptionsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

300

04 May 2022

Improving Biomedical Information Retrieval with Neural RetrieversAAAI Conference on Artificial Intelligence (AAAI), 2022

314

19 Jan 2022

Zero-shot and Few-shot Learning with Knowledge Graphs: A Comprehensive SurveyProceedings of the IEEE (Proc. IEEE), 2021

711

18 Dec 2021

Language bias in Visual Question Answering: A Survey and Taxonomy

Desen Yuan

267

16 Nov 2021

Unsupervised Natural Language Inference Using PHL Triplet Generation

403

16 Oct 2021

Weakly-Supervised Visual-Retriever-Reader for Knowledge-based Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

337

09 Sep 2021

Weakly Supervised Relative Spatial Reasoning for Visual Question Answering

Yezhou Yang

194

04 Sep 2021