Progressive Attention Memory Network for Movie Story Question Answering

18 April 2019

Papers citing "Progressive Attention Memory Network for Movie Story Question Answering"

34 / 34 papers shown

Cross-Modal Reasoning with Event Correlation for Video Question Answering

192

20 Dec 2023

Learning Fine-Grained Visual Understanding for Video Question Answering via Decoupling Spatial-Temporal ModelingBritish Machine Vision Conference (BMVC), 2022

Hsin-Ying Lee

Hung-Ting Su

312

08 Oct 2022

Frame-Subtitle Self-Supervision for Multi-Modal Video Question Answering

Jiong Wang

Zhou Zhao

Weike Jin

139

08 Sep 2022

Clover: Towards A Unified Video-Language Alignment and Fusion ModelComputer Vision and Pattern Recognition (CVPR), 2022

283

16 Jul 2022

From Representation to Reasoning: Towards both Evidence and Commonsense Reasoning for Video Question-AnsweringComputer Vision and Pattern Recognition (CVPR), 2022

Jiangtong Li

Li Niu

Liqing Zhang

193

30 May 2022

Multilevel Hierarchical Network with Multiscale Sampling for Video Question AnsweringInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Yuan Gao

181

09 May 2022

All in One: Exploring Unified Video-Language Pre-trainingComputer Vision and Pattern Recognition (CVPR), 2022

Rui Yan

Ying Shan

313

237

14 Mar 2022

Video Question Answering: Datasets, Algorithms and ChallengesConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Wei Ji

332

115

02 Mar 2022

NEWSKVQA: Knowledge-Aware News Video Question AnsweringPacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD), 2022

Pranay Gupta

Manish Gupta

257

08 Feb 2022

Temporal Pyramid Transformer with Multimodal Interaction for Video Question Answering

Yuan Gao

184

10 Sep 2021

Bridge to Answer: Structure-aware Graph Interaction Network for Video Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2021

Jungin Park

Jiyoung Lee

Kwanghoon Sohn

438

111

29 Apr 2021

Temporal Query Networks for Fine-grained Video UnderstandingComputer Vision and Pattern Recognition (CVPR), 2021

Chuhan Zhang

Ankush Gupta

Andrew Zisserman

272

19 Apr 2021

On the hidden treasure of dialog in video question answeringIEEE International Conference on Computer Vision (ICCV), 2021

238

26 Mar 2021

Structured Co-reference Graph Attention for Video-grounded DialogueAAAI Conference on Artificial Intelligence (AAAI), 2021

203

24 Mar 2021

Multi-Modal Answer Validation for Knowledge-Based VQAAAAI Conference on Artificial Intelligence (AAAI), 2021

Jialin Wu

Jiasen Lu

Ashish Sabharwal

Roozbeh Mottaghi

418

168

23 Mar 2021

Semantic Grouping Network for Video CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2021

261

151

01 Feb 2021

Recent Advances in Video Question Answering: A Review of Datasets and Methods

Devshree Patel

Ratnam Parikh

Yesha Shastri

277

15 Jan 2021

Learning Dynamic Network Using a Reuse Gate Function in Semi-supervised Video Object SegmentationComputer Vision and Pattern Recognition (CVPR), 2020

373

21 Dec 2020

Trying Bilinear Pooling in Video-QA

T. Winterbottom

S. Xiao

A. McLean

Noura Al Moubayed

211

18 Dec 2020

SCNet: Training Inference Sample Consistency for Instance SegmentationAAAI Conference on Artificial Intelligence (AAAI), 2020

317

106

18 Dec 2020

iPerceive: Applying Common-Sense Reasoning to Multi-Modal Dense Video Captioning and Video Question Answering

Vasu Sharma

Gurneet Arora

Navpreet Kaloty

201

16 Nov 2020

TTVOS: Lightweight Video Object Segmentation with Adaptive Template Attention Module and Temporal Consistency Loss

214

09 Nov 2020

MMFT-BERT: Multimodal Fusion Transformer with BERT Encodings for Visual Question AnsweringFindings (Findings), 2020

216

27 Oct 2020

Hierarchical Conditional Relation Networks for Multimodal Video Question AnsweringInternational Journal of Computer Vision (IJCV), 2020

379

18 Oct 2020

Self-supervised pre-training and contrastive representation learning for multiple-choice video QAAAAI Conference on Artificial Intelligence (AAAI), 2020

287

17 Sep 2020

Knowledge-Based Video Question Answering with Unsupervised Scene DescriptionsEuropean Conference on Computer Vision (ECCV), 2020

Noa Garcia

Yuta Nakashima

250

17 Jul 2020

PA-GAN: Progressive Attention Generative Adversarial Network for Facial Attribute Editing

127

12 Jul 2020

Modality Shifting Attention Network for Multi-modal Video Question Answering

199

04 Jul 2020

Dense-Caption Matching and Frame-Selection Gating for Temporal Localization in VideoQA

Hyounghun Kim

Zineng Tang

Joey Tianyi Zhou

140

13 May 2020

Character Matters: Video Story Understanding with Character-Aware Relations

231

09 May 2020

Hierarchical Conditional Relation Networks for Video Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2020

396

284

25 Feb 2020

Multimodal Transformer with Pointer Network for the DSTC8 AVSD Challenge

Hung Le

Nancy F. Chen

146

25 Feb 2020

Neural Reasoning, Fast and Slow, for Video Question AnsweringIEEE International Joint Conference on Neural Network (IJCNN), 2019

198

10 Jul 2019

TVQA+: Spatio-Temporal Grounding for Video Question Answering

224

256

25 Apr 2019