v1v2v3v4 (latest)

FVQA: Fact-based Visual Question Answering

17 June 2016

Peng Wang

Qi Wu

Chunhua Shen

Papers citing "FVQA: Fact-based Visual Question Answering"

50 / 241 papers shown

Entity-Focused Dense Passage Retrieval for Outside-Knowledge Visual Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Jialin Wu

Raymond J. Mooney

RALM

244

18 Oct 2022

COFAR: Commonsense and Factual Reasoning in Image Search

147

16 Oct 2022

TransAlign: Fully Automatic and Effective Entity Alignment for Knowledge Graphs

Rui Zhang

Xiaoyan Zhao

Bayu Distiawan Trisedya

Min Yang

Hong Cheng

Jianzhong Qi

102

16 Oct 2022

Learning by Asking Questions for Knowledge-based Novel Object RecognitionInternational Journal of Computer Vision (IJCV), 2022

Kohei Uehara

Tatsuya Harada

194

12 Oct 2022

Retrieval Augmented Visual Question Answering with Outside KnowledgeConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Weizhe Lin

Bill Byrne

RALM

236

111

07 Oct 2022

A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented PerspectiveIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Chaoqi Chen

379

133

27 Sep 2022

CLEVR-Math: A Dataset for Compositional Language, Visual and Mathematical ReasoningInternational Workshop on Neural-Symbolic Learning and Reasoning (NeSy), 2022

Adam Dahlgren Lindström

Savitha Sam Abraham

120

10 Aug 2022

LaKo: Knowledge-driven Visual Question Answering via Late Knowledge-to-Text Injection

Ningyu Zhang

235

26 Jul 2022

Visual Perturbation-aware Collaborative Learning for Overcoming the Language Prior Problem

Yan Yan

240

24 Jul 2022

Semantic-aware Modular Capsule Routing for Visual Question AnsweringIEEE Transactions on Image Processing (IEEE TIP), 2022

191

21 Jul 2022

A Unified End-to-End Retriever-Reader Framework for Knowledge-based VQAACM Multimedia (ACM MM), 2022

198

30 Jun 2022

cViL: Cross-Lingual Training of Vision-Language Models using Knowledge DistillationInternational Conference on Pattern Recognition (ICPR), 2022

303

07 Jun 2022

A-OKVQA: A Benchmark for Visual Question Answering using World KnowledgeEuropean Conference on Computer Vision (ECCV), 2022

384

764

03 Jun 2022

REVIVE: Regional Visual Representation Matters in Knowledge-Based Visual Question AnsweringNeural Information Processing Systems (NeurIPS), 2022

Lu Yuan

319

02 Jun 2022

TIE: Topological Information Enhanced Structural Reading Comprehension on Web PagesNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

Hongshen Xu

200

13 May 2022

Hypergraph Transformer: Weakly-supervised Multi-hop Reasoning for Knowledge-based Visual Question AnsweringAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

142

22 Apr 2022

Attention Mechanism based Cognition-level Scene Understanding

Xuejiao Tang

Tai Le Quy

LRM

339

17 Apr 2022

Reasoning with Multi-Structure Commonsense Knowledge in Visual Dialog

164

10 Apr 2022

Learning Commonsense-aware Moment-Text Alignment for Fast Video Temporal Grounding

239

04 Apr 2022

Text2Pos: Text-to-Point-Cloud Cross-Modal LocalizationComputer Vision and Pattern Recognition (CVPR), 2022

Manuel Kolmet

Qunjie Zhou

Aljosa Osep

Laura Leal-Taixe

293

28 Mar 2022

MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

Qi Wu

171

17 Mar 2022

K-VQG: Knowledge-aware Visual Question Generation for Common-sense AcquisitionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Kohei Uehara

Tatsuya Harada

153

15 Mar 2022

Dynamic Key-value Memory Enhanced Multi-step Graph Reasoning for Knowledge-based Visual Question AnsweringAAAI Conference on Artificial Intelligence (AAAI), 2022

Mingxiao Li

Marie-Francine Moens

216

06 Mar 2022

Joint Answering and Explanation for Visual Commonsense ReasoningIEEE Transactions on Image Processing (IEEE TIP), 2022

255

25 Feb 2022

A Review on Methods and Applications in Multimodal Deep Learning

213

149

18 Feb 2022

Multi-Modal Knowledge Graph Construction and Application: A SurveyIEEE Transactions on Knowledge and Data Engineering (TKDE), 2022

Zhixu Li

210

237

11 Feb 2022

The Abduction of Sherlock Holmes: A Dataset for Visual Abductive ReasoningEuropean Conference on Computer Vision (ECCV), 2022

Yejin Choi

497

10 Feb 2022

NEWSKVQA: Knowledge-Aware News Video Question AnsweringPacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), 2022

Pranay Gupta

Manish Gupta

243

08 Feb 2022

A Thousand Words Are Worth More Than a Picture: Natural Language-Centric Outside-Knowledge Visual Question Answering

Govind Thattai

150

14 Jan 2022

Self-Training Vision Language BERTs with a Unified Conditional Model

Xiaofeng Yang

Fengmao Lv

Fayao Liu

Guosheng Lin

SSL VLM

313

06 Jan 2022

Zero-shot and Few-shot Learning with Knowledge Graphs: A Comprehensive SurveyProceedings of the IEEE (Proc. IEEE), 2021

641

18 Dec 2021

KAT: A Knowledge Augmented Transformer for Vision-and-Language

Liangke Gui

Borui Wang

Qiuyuan Huang

Alexander G. Hauptmann

Yonatan Bisk

Jianfeng Gao

245

196

16 Dec 2021

3D Question Answering

261

15 Dec 2021

Improving and Diagnosing Knowledge-Based Visual Question Answering via Entity Enhanced Knowledge Injection

Diego Garcia-Olano

Yasumasa Onoe

Joydeep Ghosh

168

13 Dec 2021

Two-stage Rule-induction Visual Reasoning on RPMs with an Application to Video Prediction

302

24 Nov 2021

Medical Visual Question Answering: A Survey

Danli Shi

Qi Wu

320

178

19 Nov 2021

Transferring Domain-Agnostic Knowledge in Video Question Answering

137

26 Oct 2021

Coarse-to-Fine Reasoning for Visual Question Answering

304

06 Oct 2021

A Survey of Knowledge Enhanced Pre-trained Models

440

01 Oct 2021

Knowledge-based Embodied Question Answering

Sinan Tan

266

16 Sep 2021

Image Captioning for Effective Use of Language Models in Knowledge-Based Visual Question Answering

Ander Salaberria

Gorka Azkune

Oier López de Lacalle

Aitor Soroa Etxabe

Eneko Agirre

300

15 Sep 2021

An Empirical Study of GPT-3 for Few-Shot Knowledge-Based VQAAAAI Conference on Artificial Intelligence (AAAI), 2021

Zicheng Liu

590

489

10 Sep 2021

Temporal Pyramid Transformer with Multimodal Interaction for Video Question Answering

Yuan Gao

184

10 Sep 2021

Weakly-Supervised Visual-Retriever-Reader for Knowledge-based Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

250

09 Sep 2021

Weakly Supervised Relative Spatial Reasoning for Visual Question Answering

Yezhou Yang

163

04 Sep 2021

EKTVQA: Generalized use of External Knowledge to empower Scene Text in Text-VQAIEEE Access (IEEE Access), 2021

Arka Ujjal Dey

Ernest Valveny

Gaurav Harit

353

22 Aug 2021

Interpretable Visual Understanding with Cognitive Attention NetworkInternational Conference on Artificial Neural Networks (ICANN), 2021

Wenbin Zhang

275

06 Aug 2021

Zero-shot Visual Question Answering using Knowledge Graph

Huajun Chen

314

12 Jul 2021

Cognitive Visual Commonsense Reasoning Using Dynamic Working Memory

Wenbin Zhang

195

04 Jul 2021

NAAQA: A Neural Architecture for Acoustic Question AnsweringIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Jerome Abdelnour

Jean Rouat

G. Salvi

291

11 Jun 2021