v1v2 (latest)

Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classification

13 December 2017

Papers citing "Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classification"

50 / 675 papers shown

TrUMAn: Trope Understanding in Movies and AnimationsInternational Conference on Information and Knowledge Management (CIKM), 2021

Hung-Ting Su

173

10 Aug 2021

Video Contrastive Learning with Global Context

244

05 Aug 2021

Token Shift Transformer for Video ClassificationACM Multimedia (ACM MM), 2021

Hao Zhang

Y. Hao

Chong-Wah Ngo

ViT

287

127

05 Aug 2021

Enhancing Self-supervised Video Representation Learning via Multi-level Feature OptimizationIEEE International Conference on Computer Vision (ICCV), 2021

287

04 Aug 2021

Skeleton Cloud Colorization for Unsupervised 3D Action Representation LearningIEEE International Conference on Computer Vision (ICCV), 2021

Jun Liu

276

110

04 Aug 2021

Temporal Alignment Prediction for Few-Shot Video Classification

171

26 Jul 2021

Spatio-Temporal Representation Factorization for Video-based Person Re-IdentificationIEEE International Conference on Computer Vision (ICCV), 2021

Amit K. Roy-Chowdhury

Ziyan Wu

308

25 Jul 2021

Transcript to Video: Efficient Clip Sequencing from TextsACM Multimedia (ACM MM), 2021

228

25 Jul 2021

Adaptive Recursive Circle Framework for Fine-grained Action RecognitionIEEE International Conference on Multimedia and Expo (ICME), 2021

Hanxi Lin

Xinxiao Wu

Jiebo Luo

179

25 Jul 2021

EAN: Event Adaptive Network for Enhanced Action RecognitionInternational Journal of Computer Vision (IJCV), 2021

Guangtao Zhai

179

22 Jul 2021

Let's Play for Action: Recognizing Activities of Daily Living by Learning from Life Simulation Video Games

227

12 Jul 2021

Delta Sampling R-BERT for limited data and low-light action recognition

203

12 Jul 2021

Aligning Correlation Information for Domain Adaptation in Action RecognitionIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

Yuecong Xu

215

11 Jul 2021

Modality specific U-Net variants for biomedical image segmentation: A surveyArtificial Intelligence Review (AIR), 2021

Narinder Singh Punn

Sonali Agarwal

SSeg

379

198

09 Jul 2021

Video 3D Sampling for Self-supervised Representation Learning

118

08 Jul 2021

VidLanKD: Improving Language Understanding via Video-Distilled Knowledge Transfer

195

06 Jul 2021

Inter-intra Variant Dual Representations forSelf-supervised Video Recognition

220

02 Jul 2021

iMiGUE: An Identity-free Video Dataset for Micro-Gesture Understanding and Emotion AnalysisComputer Vision and Pattern Recognition (CVPR), 2021

225

109

01 Jul 2021

Attention Bottlenecks for Multimodal FusionNeural Information Processing Systems (NeurIPS), 2021

588

704

30 Jun 2021

When Video Classification Meets Incremental ClassesACM Multimedia (ACM MM), 2021

Xi Li

200

30 Jun 2021

Long-Short Temporal Modeling for Efficient Action RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Liyu Wu

Yuexian Zou

Can Zhang

106

30 Jun 2021

Unsupervised Discovery of Actions in Instructional VideosBritish Machine Vision Conference (BMVC), 2021

171

28 Jun 2021

Hyperbolic Busemann Learning with Ideal PrototypesNeural Information Processing Systems (NeurIPS), 2021

Mina Ghadimi Atigh

Martin Keller-Ressel

Pascal Mettes

236

28 Jun 2021

Can An Image Classifier Suffice For Action Recognition?International Conference on Learning Representations (ICLR), 2021

286

26 Jun 2021

Hierarchical Object-oriented Spatio-Temporal Reasoning for Video Question Answering

233

25 Jun 2021

Video Swin Transformer

488

1,884

24 Jun 2021

TokenLearner: What Can 8 Learned Tokens Do for Images and Videos?

646

155

21 Jun 2021

All You Can Embed: Natural Language based Vehicle Retrieval with Spatio-Temporal Transformers

140

18 Jun 2021

Self-supervised Video Representation Learning with Cross-Stream Prototypical ContrastingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2021

292

18 Jun 2021

Multi-Granularity Network with Modal Attention for Dense Affective Understanding

18 Jun 2021

MaCLR: Motion-aware Contrastive Learning of Representations for VideosEuropean Conference on Computer Vision (ECCV), 2021

194

17 Jun 2021

Multi-level Attention Fusion Network for Audio-visual Event Recognition

Mathilde Brousmiche

Jean Rouat

Stéphane Dupont

294

12 Jun 2021

Keeping Your Eye on the Ball: Trajectory Attention in Video TransformersNeural Information Processing Systems (NeurIPS), 2021

Ishan Misra Florian Metze

Christoph Feichtenhofer

Andrea Vedaldi

João F. Henriques

293

342

09 Jun 2021

VALUE: A Multi-Task Benchmark for Video-and-Language Understanding Evaluation

...

Zicheng Liu

279

117

08 Jun 2021

Transformed ROIs for Capturing Visual Transformations in VideosComputer Vision and Image Understanding (CVIU), 2021

Abhinav Rai

Fadime Sener

Angela Yao

ViT

234

06 Jun 2021

ASCNet: Self-supervised Video Representation Learning with Appearance-Speed ConsistencyIEEE International Conference on Computer Vision (ICCV), 2021

Errui Ding

163

04 Jun 2021

CT-Net: Channel Tensorization Network for Video ClassificationInternational Conference on Learning Representations (ICLR), 2021

Yu Qiao

169

03 Jun 2021

TSI: Temporal Saliency Integration for Video Action Recognition

Haisheng Su

Yu Qiao

198

02 Jun 2021

Connecting Language and Vision for Natural Language-Based Vehicle Retrieval

Shuai Bai

Chang Zhou

Yi Yang

Hongxia Yang

239

31 May 2021

Multi-Modal Semantic Inconsistency Detection in Social Media News PostsConference on Multimedia Modeling (MMM), 2021

S. McCrae

Kehan Wang

A. Zakhor

148

26 May 2021

DSANet: Dynamic Segment Aggregation Network for Video-Level Representation LearningACM Multimedia (ACM MM), 2021

Wenhao Wu

Yuxiang Zhao

Yanwu Xu

Xiao Tan

...

219

25 May 2021

Temporal Action Proposal Generation with Transformers

149

25 May 2021

VLM: Task-agnostic Video-Language Model Pre-training for Video UnderstandingFindings (Findings), 2021

Hu Xu

Gargi Ghosh

Po-Yao (Bernie) Huang

Prahal Arora

Masoumeh Aminzadeh

Christoph Feichtenhofer

Florian Metze

Luke Zettlemoyer

343

146

20 May 2021

MutualNet: Adaptive ConvNet via Mutual Learning from Different Model ConfigurationsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Ravikumar Balakrishnan

258

14 May 2021

Collaborative Spatial-Temporal Modeling for Language-Queried Video Actor SegmentationComputer Vision and Pattern Recognition (CVPR), 2021

208

14 May 2021

REGINA - Reasoning Graph Convolutional Networks in Human Action RecognitionIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2021

163

14 May 2021

Designing Multimodal Datasets for NLP Challenges

204

12 May 2021

Temporal-Spatial Feature Pyramid for Video Saliency Detection

Qinyao Chang

Shiping Zhu

218

10 May 2021

Adaptive Focus for Efficient Video RecognitionIEEE International Conference on Computer Vision (ICCV), 2021

Yulin Wang

Gao Huang

298

110

07 May 2021

Motion-Augmented Self-Training for Video Recognition at Smaller ScaleIEEE International Conference on Computer Vision (ICCV), 2021

155

04 May 2021