R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering

24 May 2018

Wei Zhang

Papers citing "R-VQA: Learning Visual Relation Facts with Semantic Attention for Visual Question Answering"

33 / 33 papers shown

Title
FedMobile: Enabling Knowledge Contribution-aware Multi-modal Federated Learning with Incomplete Modalities Yi Liu Cong Wang Xingliang Yuan 42 1 0 20 Feb 2025
IW-Bench: Evaluating Large Multimodal Models for Converting Image-to-Web Hongcheng Guo Wei Zhang Junhao Chen Yaonan Gu Jian Yang ... Binyuan Hui Tianyu Liu Jianxin Ma Chang Zhou Zhoujun Li 25 1 0 14 Sep 2024
INF-LLaVA: Dual-perspective Perception for High-Resolution Multimodal Large Language Model Yiwei Ma Zhibin Wang Xiaoshuai Sun Weihuang Lin Qiang-feng Zhou Jiayi Ji Rongrong Ji MLLM VLM 47 1 0 23 Jul 2024
GeReA: Question-Aware Prompt Captions for Knowledge-based Visual Question Answering Ziyu Ma Shutao Li Bin Sun Jianfei Cai Zuxiang Long Fuyan Ma 26 1 0 04 Feb 2024
COCO is "ALL'' You Need for Visual Instruction Fine-tuning Xiaotian Han Yiqi Wang Bohan Zhai Quanzeng You Hongxia Yang VLM MLLM 28 2 0 17 Jan 2024
Survey of Natural Language Processing for Education: Taxonomy, Systematic Review, and Future Trends Yunshi Lan Xinyuan Li Hanyue Du Xuesong Lu Ming Gao Weining Qian Aoying Zhou 33 1 0 15 Jan 2024
Multi-Clue Reasoning with Memory Augmentation for Knowledge-based Visual Question Answering Chengxiang Yin Zhengping Che Kun Wu Zhiyuan Xu Jian Tang 17 0 0 20 Dec 2023
From Image to Language: A Critical Analysis of Visual Question Answering (VQA) Approaches, Challenges, and Opportunities Md Farhan Ishmam Md Sakib Hossain Shovon M. F. Mridha Nilanjan Dey 35 36 0 01 Nov 2023
Negative Object Presence Evaluation (NOPE) to Measure Object Hallucination in Vision-Language Models Holy Lovenia Wenliang Dai Samuel Cahyawijaya Ziwei Ji Pascale Fung MLLM 25 47 0 09 Oct 2023
ECG-QA: A Comprehensive Question Answering Dataset Combined With Electrocardiogram Jungwoo Oh Gyubok Lee Seongsu Bae Joon-Myoung Kwon E. Choi 10 16 0 21 Jun 2023
Combo of Thinking and Observing for Outside-Knowledge VQA Q. Si Yuchen Mo Zheng Lin Huishan Ji Weiping Wang 35 13 0 10 May 2023
Learn to Explain: Multimodal Reasoning via Thought Chains for Science Question Answering Pan Lu Swaroop Mishra Tony Xia Liang Qiu Kai-Wei Chang Song-Chun Zhu Oyvind Tafjord Peter Clark A. Kalyan ELM ReLM LRM 211 1,105 0 20 Sep 2022
Modern Question Answering Datasets and Benchmarks: A Survey Zhen Wang 33 22 0 30 Jun 2022
Structured Two-stream Attention Network for Video Question Answering Lianli Gao Pengpeng Zeng Jingkuan Song Yuan-Fang Li Wu Liu Tao Mei Heng Tao Shen 25 68 0 02 Jun 2022
NEWSKVQA: Knowledge-Aware News Video Question Answering Pranay Gupta Manish Gupta 22 7 0 08 Feb 2022
A Thousand Words Are Worth More Than a Picture: Natural Language-Centric Outside-Knowledge Visual Question Answering Feng Gao Q. Ping Govind Thattai Aishwarya N. Reganti Yingting Wu Premkumar Natarajan 13 16 0 14 Jan 2022
Bilateral Cross-Modality Graph Matching Attention for Feature Fusion in Visual Question Answering Jianjian Cao Xiameng Qin Sanyuan Zhao Jianbing Shen 23 20 0 14 Dec 2021
IconQA: A New Benchmark for Abstract Diagram Understanding and Visual Language Reasoning Pan Lu Liang Qiu Jiaqi Chen Tony Xia Yizhou Zhao Wei Zhang Zhou Yu Xiaodan Liang Song-Chun Zhu AIMat 28 183 0 25 Oct 2021
Coarse-to-Fine Reasoning for Visual Question Answering Binh X. Nguyen Tuong Khanh Long Do Huy Tran Erman Tjiputra Quang-Dieu Tran A. Nguyen NAI 62 36 0 06 Oct 2021
Exploring Semantic Relationships for Unpaired Image Captioning Fenglin Liu Meng Gao Tianhao Zhang Yuexian Zou 4 7 0 20 Jun 2021
A survey on VQA_Datasets and Approaches Yeyun Zou Qiyu Xie 40 18 0 02 May 2021
Visual Question Answering based on Local-Scene-Aware Referring Expression Generation Jungjun Kim Dong-Gyu Lee Jialin Wu Hong G Jung Seong-Whan Lee ObjD 11 21 0 22 Jan 2021
Visual Relation Grounding in Videos Junbin Xiao Xindi Shang Xun Yang Sheng Tang Tat-Seng Chua 20 40 0 17 Jul 2020
AVR: Attention based Salient Visual Relationship Detection Jianming Lv Qin-zhe Xiao Jiajie Zhong 6 12 0 16 Mar 2020
A Review on Intelligent Object Perception Methods Combining Knowledge-based Reasoning and Machine Learning Filippos Gouidis Alexandros Vassiliades T. Patkos Antonis Argyros Nick Bassiliades Dimitris Plexousakis OCL 29 12 0 26 Dec 2019
KnowIT VQA: Answering Knowledge-Based Questions about Videos Noa Garcia Mayu Otani Chenhui Chu Yuta Nakashima 9 76 0 23 Oct 2019
Generating Question Relevant Captions to Aid Visual Question Answering Jialin Wu Zeyuan Hu Raymond J. Mooney 15 42 0 03 Jun 2019
Relation-Aware Graph Attention Network for Visual Question Answering Linjie Li Zhe Gan Yu Cheng Jingjing Liu GNN 28 341 0 29 Mar 2019
On Class Imbalance and Background Filtering in Visual Relationship Detection Alessio Sarullo Tingting Mu 20 4 0 20 Mar 2019
VrR-VG: Refocusing Visually-Relevant Relationships Yuanzhi Liang Yalong Bai Wei Zhang Xueming Qian Li Zhu Tao Mei 3DH 14 8 0 01 Feb 2019
Question-Guided Hybrid Convolution for Visual Question Answering Peng Gao Pan Lu Hongsheng Li Shuang Li Yikang Li S. Hoi Xiaogang Wang 24 68 0 08 Aug 2018
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 144 1,465 0 06 Jun 2016
The Application of Two-level Attention Models in Deep Convolutional Neural Network for Fine-grained Image Classification Tianjun Xiao Yichong Xu Kuiyuan Yang Jiaxing Zhang Yuxin Peng Zheng-Wei Zhang 153 788 0 24 Nov 2014