Progressive Attention Memory Network for Movie Story Question Answering

18 April 2019

Papers citing "Progressive Attention Memory Network for Movie Story Question Answering"

33 / 33 papers shown

Cross-Modal Reasoning with Event Correlation for Video Question Answering

181

20 Dec 2023

Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal ModelingBritish Machine Vision Conference (BMVC), 2022

Hsin-Ying Lee

Hung-Ting Su

305

08 Oct 2022

Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering

Jiong Wang

Zhou Zhao

Weike Jin

128

08 Sep 2022

Clover: Towards A Unified Video-Language Alignment and Fusion ModelComputer Vision and Pattern Recognition (CVPR), 2022

278

16 Jul 2022

From Representation to Reasoning: Towards both Evidence and Commonsense Reasoning for Video Question-AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

Jiangtong Li

Li Niu

Liqing Zhang

183

30 May 2022

Multilevel Hierarchical Network with Multiscale Sampling for Video Question AnsweringInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Yuan Gao

160

09 May 2022

All in One: Exploring Unified Video-Language Pre-trainingComputer Vision and Pattern Recognition (CVPR), 2022

Rui Yan

Ying Shan

293

236

14 Mar 2022

Video Question Answering: Datasets, Algorithms and ChallengesConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Wei Ji

329

114

02 Mar 2022

NEWSKVQA: Knowledge-Aware News Video Question AnsweringPacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), 2022

Pranay Gupta

Manish Gupta

235

08 Feb 2022

Temporal Pyramid Transformer with Multimodal Interaction for Video Question Answering

Yuan Gao

181

10 Sep 2021

Bridge to Answer: Structure-aware Graph Interaction Network for Video Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2021

Jungin Park

Jiyoung Lee

Kwanghoon Sohn

431

110

29 Apr 2021

Temporal Query Networks for Fine-grained Video UnderstandingComputer Vision and Pattern Recognition (CVPR), 2021

Chuhan Zhang

Ankush Gupta

Andrew Zisserman

251

19 Apr 2021

On the hidden treasure of dialog in video question answeringIEEE International Conference on Computer Vision (ICCV), 2021

226

26 Mar 2021

Structured Co-reference Graph Attention for Video-grounded DialogueAAAI Conference on Artificial Intelligence (AAAI), 2021

202

24 Mar 2021

Multi-Modal Answer Validation for Knowledge-Based VQAAAAI Conference on Artificial Intelligence (AAAI), 2021

Jialin Wu

Jiasen Lu

Ashish Sabharwal

Roozbeh Mottaghi

369

166

23 Mar 2021

Semantic Grouping Network for Video CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2021

250

151

01 Feb 2021

Recent Advances in Video Question Answering: A Review of Datasets and Methods

Devshree Patel

Ratnam Parikh

Yesha Shastri

270

15 Jan 2021

Learning Dynamic Network Using a Reuse Gate Function in Semi-supervised Video Object SegmentationComputer Vision and Pattern Recognition (CVPR), 2020

367

21 Dec 2020

Trying Bilinear Pooling in Video-QA

T. Winterbottom

S. Xiao

A. McLean

Noura Al Moubayed

207

18 Dec 2020

SCNet: Training Inference Sample Consistency for Instance SegmentationAAAI Conference on Artificial Intelligence (AAAI), 2020

317

106

18 Dec 2020

iPerceive: Applying Common-Sense Reasoning to Multi-Modal Dense Video Captioning and Video Question Answering

Vasu Sharma

Gurneet Arora

Navpreet Kaloty

196

16 Nov 2020

TTVOS: Lightweight Video Object Segmentation with Adaptive Template Attention Module and Temporal Consistency Loss

214

09 Nov 2020

MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question AnsweringFindings (Findings), 2020

213

27 Oct 2020

Hierarchical Conditional Relation Networks for Multimodal Video Question AnsweringInternational Journal of Computer Vision (IJCV), 2020

342

18 Oct 2020

Self-supervised pre-training and contrastive representation learning for multiple-choice video QAAAAI Conference on Artificial Intelligence (AAAI), 2020

284

17 Sep 2020

Knowledge-Based Video Question Answering with Unsupervised Scene DescriptionsEuropean Conference on Computer Vision (ECCV), 2020

Noa Garcia

Yuta Nakashima

250

17 Jul 2020

PA-GAN: Progressive Attention Generative Adversarial Network for Facial Attribute Editing

118

12 Jul 2020

Modality Shifting Attention Network for Multi-modal Video Question Answering

188

04 Jul 2020

Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA

Hyounghun Kim

Zineng Tang

Joey Tianyi Zhou

128

13 May 2020

Hierarchical Conditional Relation Networks for Video Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2020

358

282

25 Feb 2020

Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge

Hung Le

Nancy F. Chen

132

25 Feb 2020

Neural Reasoning, Fast and Slow, for Video Question AnsweringIEEE International Joint Conference on Neural Network (IJCNN), 2019

188

10 Jul 2019

TVQA+: Spatio-Temporal Grounding for Video Question Answering

214

253

25 Apr 2019