v1v2v3v4 (latest)

FVQA: Fact-based Visual Question Answering

17 June 2016

Peng Wang

Qi Wu

Chunhua Shen

Papers citing "FVQA: Fact-based Visual Question Answering"

50 / 241 papers shown

Discriminative Triad Matching and Reconstruction for Weakly Referring Expression GroundingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

163

168

08 Jun 2021

Recent Advances and Trends in Multimodal Deep Learning: A Review

Xi Li

340

24 May 2021

AdaVQA: Overcoming Language Priors with Adapted Margin Cosine LossInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Ji Zhang

145

05 May 2021

A survey on VQA_Datasets and Approaches

Yeyun Zou

Qiyu Xie

277

02 May 2021

Cross-Modal Retrieval Augmentation for Multi-Modal ClassificationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Shir Gur

Natalia Neverova

C. Stauffer

Ser-Nam Lim

Douwe Kiela

A. Reiter

217

16 Apr 2021

Towards General Purpose Vision SystemsComputer Vision and Pattern Recognition (CVPR), 2021

275

01 Apr 2021

Domain-robust VQA with diverse datasets and methods but no target labelsComputer Vision and Pattern Recognition (CVPR), 2021

300

29 Mar 2021

Multi-Modal Answer Validation for Knowledge-Based VQAAAAI Conference on Artificial Intelligence (AAAI), 2021

Jialin Wu

Jiasen Lu

Ashish Sabharwal

Roozbeh Mottaghi

377

167

23 Mar 2021

SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question AnsweringIEEE International Symposium on Biomedical Imaging (ISBI), 2021

Xiao-Ming Wu

255

438

18 Feb 2021

Reasoning over Vision and Language: Exploring the Benefits of Supplemental Knowledge

213

15 Jan 2021

Seeing is Knowing! Fact-based Visual Question Answering using Knowledge Graph Embeddings

Kiran Ramnath

M. Hasegawa-Johnson

214

31 Dec 2020

KRISP: Integrating Implicit and Symbolic Knowledge for Open-Domain Knowledge-Based VQAComputer Vision and Pattern Recognition (CVPR), 2020

Devi Parikh

272

226

20 Dec 2020

Knowledge-Routed Visual Question Reasoning: Challenges for Deep Representation EmbeddingIEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS), 2020

Xiaodan Liang

222

14 Dec 2020

Simple is not Easy: A Simple Strong Baseline for TextVQA and TextCapsAAAI Conference on Artificial Intelligence (AAAI), 2020

Qi Zhu

Chenyu Gao

Peng Wang

Qi Wu

202

09 Dec 2020

Transformation Driven Visual ReasoningComputer Vision and Pattern Recognition (CVPR), 2020

Liang Pang

181

26 Nov 2020

XTQA: Span-Level Explanations of the Textbook Question AnsweringIEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS), 2020

Jun Liu

209

25 Nov 2020

Generating Natural Questions from Images for Multimodal AssistantsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

184

17 Nov 2020

Loss re-scaling VQA: Revisiting the LanguagePrior Problem from a Class-imbalance ViewIEEE Transactions on Image Processing (TIP), 2020

Min Zhang

362

30 Oct 2020

New Ideas and Trends in Deep Multimodal Content Understanding: A ReviewNeurocomputing (Neurocomputing), 2020

329

16 Oct 2020

That looks interesting! Personalizing Communication and Segmentation with Random Forest Node Embeddings

Weiwei Wang

Wiebke Eberhardt

Stefano Bromuri

165

13 Sep 2020

Cross-modal Knowledge Reasoning for Knowledge-based Visual Question AnsweringPattern Recognition (Pattern Recognit.), 2020

Yujing Wang

198

113

31 Aug 2020

A Dataset and Baselines for Visual Question Answering on Art

Zihua Liu

157

28 Aug 2020

Knowledge Graph Extraction from Videos

102

20 Jul 2020

Knowledge-Based Video Question Answering with Unsupervised Scene DescriptionsEuropean Conference on Computer Vision (ECCV), 2020

Noa Garcia

Yuta Nakashima

250

17 Jul 2020

Mucko: Multi-Layer Cross-Modal Knowledge Reasoning for Fact-based Visual Question Answering

Yujing Wang

Qi Wu

250

149

16 Jun 2020

Give Me Something to Eat: Referring Expression Comprehension with Commonsense KnowledgeACM Multimedia (ACM MM), 2020

Peng Wang

Dongyang Liu

Hui Li

Qi Wu

ObjD

217

02 Jun 2020

Structured Multimodal Attentions for TextVQAIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

Peng Wang

Yuliang Liu

Qi Wu

275

01 Jun 2020

Visuo-Linguistic Question Answering (VLQA) Challenge

Shailaja Keyur Sampat

Yezhou Yang

Chitta Baral

CoGe

138

01 May 2020

Knowledge-Based Visual Question Answering in Videos

17 Apr 2020

An Entropy Clustering Approach for Assessing Visual Question DifficultyIEEE Access (IEEE Access), 2020

Shuníchi Satoh

304

12 Apr 2020

Understanding Knowledge Gaps in Visual Question Answering: Implications for Gap Identification and Testing

Srinivasan Parthasarathy

173

08 Apr 2020

Multi-Modal Graph Neural Network for Joint Reasoning on Vision and Scene TextComputer Vision and Pattern Recognition (CVPR), 2020

Ruiping Wang

212

126

31 Mar 2020

Linguistically Driven Graph Capsule Network for Visual Question Reasoning

Xiaodan Liang

281

23 Mar 2020

Multilayer Dense Connections for Hierarchical Concept Classification

T. Parag

Hongcheng Wang

136

19 Mar 2020

On the General Value of Evidence, and Bilingual Scene-Text Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2020

Xinyu Wang

Yuliang Liu

Chunhua Shen

Lianwen Jin

207

116

24 Feb 2020

Augmenting Visual Question Answering with Semantic Frame Information in a Multitask Learning ApproachInternational Computer Science Conference (ICSC), 2020

Mehrdad Alizadeh

Barbara Di Eugenio

119

31 Jan 2020

Accuracy vs. Complexity: A Trade-off in Visual Question Answering ModelsPattern Recognition (Pattern Recognit.), 2020

M. Farazi

Salman H. Khan

Nick Barnes

204

20 Jan 2020

A Review on Intelligent Object Perception Methods Combining Knowledge-based Reasoning and Machine LearningAAAI Spring Symposium Combining Machine Learning with Knowledge Engineering (CMLKE), 2019

Filippos Gouidis

Alexandros Vassiliades

Antonis Argyros

174

26 Dec 2019

Multimodal Intelligence: Representation Learning, Information Fusion, and ApplicationsIEEE Journal on Selected Topics in Signal Processing (JSTSP), 2019

Chao Zhang

Zichao Yang

Xiaodong He

Li Deng

HAI AI4TS

325

402

10 Nov 2019

KnowIT VQA: Answering Knowledge-Based Questions about VideosAAAI Conference on Artificial Intelligence (AAAI), 2019

347

23 Oct 2019

Relational Graph Representation Learning for Open-Domain Question Answering

Sal Vivona

Kaveh Hassani

GNN NAI

116

18 Oct 2019

Multi-modal Deep Analysis for Multimedia

Wenwu Zhu

Xin Eric Wang

Hongzhi Li

219

11 Oct 2019

Explainable High-order Visual Question Reasoning: A New Benchmark and Knowledge-routed Network

Qingxing Cao

Bailin Li

Xiaodan Liang

Liang Lin

142

23 Sep 2019

CRIC: A VQA Dataset for Compositional Reasoning on Vision and CommonsenseIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

Ruiping Wang

312

08 Aug 2019

An Empirical Study on Leveraging Scene Graphs for Visual Question AnsweringBritish Machine Vision Conference (BMVC), 2019

Cheng Zhang

Wei-Lun Chao

D. Xuan

182

28 Jul 2019

Bilinear Graph Networks for Visual Question AnsweringIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2019

199

23 Jul 2019

Integrating Knowledge and Reasoning in Image UnderstandingInternational Joint Conference on Artificial Intelligence (IJCAI), 2019

140

24 Jun 2019

Adversarial Multimodal Network for Movie Question Answering

187

24 Jun 2019

A Survey of Natural Language Generation Techniques with a Focus on Dialogue Systems - Past, Present and Future Directions

Sashank Santhanam

Samira Shaikh

3DV

211

02 Jun 2019

OK-VQA: A Visual Question Answering Benchmark Requiring External KnowledgeComputer Vision and Pattern Recognition (CVPR), 2019

673

1,378

31 May 2019