v1v2v3 (latest)

StNet: Local and Global Spatial-Temporal Modeling for Action Recognition

5 November 2018

Chuang Gan

Papers citing "StNet: Local and Global Spatial-Temporal Modeling for Action Recognition"

50 / 50 papers shown

Video-STAR: Reinforcing Open-Vocabulary Action Recognition with Tools

...

203

09 Oct 2025

VT-LVLM-AR: A Video-Temporal Large Vision-Language Model Adapter for Fine-Grained Action Recognition in Long-Term Videos

131

21 Aug 2025

Dynamic and Compressive Adaptation of Transformers From Images to Videos

Limin Wang

521

13 Aug 2024

Brain-inspired Computational Modeling of Action Recognition with Recurrent Spiking Neural Networks Equipped with Reinforcement Delay Learning

144

17 Jun 2024

RNNs, CNNs and Transformers in Human Action Recognition: A Survey and a Hybrid Model

336

02 Jun 2024

Deep video representation learning: a survey

280

10 May 2024

What Can Simple Arithmetic Operations Do for Temporal Modeling?IEEE International Conference on Computer Vision (ICCV), 2023

Jingdong Wang

Wanli Ouyang

264

18 Jul 2023

Deep set conditioned latent representations for action recognitionVISIGRAPP (VISIGRAPP), 2022

240

21 Dec 2022

Dynamic Appearance: A Video Representation for Action Recognition with Joint Training

Guoxi Huang

A. Bors

261

23 Nov 2022

A Unified Multimodal De- and Re-coupling Framework for RGB-D Motion RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Fan Wang

251

16 Nov 2022

FuTH-Net: Fusing Temporal Relations and Holistic Features for Aerial Video ClassificationIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2022

Xiao Xiang Zhu

392

22 Sep 2022

MAiVAR: Multimodal Audio-Image and Video Action RecognizerVisual Communications and Image Processing (VCIP), 2022

Muhammad Bilal Shaikh

Douglas Chai

S. Islam

Naveed Akhtar

240

11 Sep 2022

Adversarial Feature Augmentation for Cross-domain Few-shot ClassificationEuropean Conference on Computer Vision (ECCV), 2022

Yan Hu

A. J. Ma

334

23 Aug 2022

Human Activity Recognition Using Cascaded Dual Attention CNN and Bi-Directional GRU FrameworkJournal of Imaging (JI), 2022

Hayat Ullah

Arslan Munir

HAI

235

09 Aug 2022

VidConv: A modernized 2D ConvNet for Efficient Video Recognition

216

08 Jul 2022

Behavior Recognition Based on the Integration of Multigranular Motion Features

137

07 Mar 2022

Attention-Based Sensor Fusion for Human Activity Recognition Using IMU Signals

131

20 Dec 2021

Decoupling and Recoupling Spatiotemporal Representation for RGB-D-based Motion Recognition

Fan Wang

Hao Li

257

16 Dec 2021

Temporal Transformer Networks with Self-Supervision for Action Recognition

Jun Li

313

14 Dec 2021

STSM: Spatio-Temporal Shift Module for Efficient Action Recognition

Zhaoqilin Yang

Gaoyun An

292

05 Dec 2021

Stacked Temporal Attention: Improving First-person Action Recognition by Emphasizing Discriminative Clips

Lijin Yang

Yifei Huang

Yusuke Sugano

Yoichi Sato

273

02 Dec 2021

GTM: Gray Temporal Model for Video Recognition

Yanping Zhang

Yongxin Yu

152

20 Oct 2021

Video Is Graph: Structured Graph Module for Video Action Recognition

Rongjie Li

Xiaojun Wu

Tianyang Xu

493

12 Oct 2021

Long-Short Temporal Modeling for Efficient Action RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Liyu Wu

Yuexian Zou

Can Zhang

123

30 Jun 2021

TSI: Temporal Saliency Integration for Video Action Recognition

Haisheng Su

Yu Qiao

272

02 Jun 2021

DSANet: Dynamic Segment Aggregation Network for Video-Level Representation LearningACM Multimedia (ACM MM), 2021

Wenhao Wu

Yuxiang Zhao

Yanwu Xu

Xiao Tan

...

310

25 May 2021

Busy-Quiet Video Disentangling for Video ClassificationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2021

Guoxi Huang

A. Bors

339

29 Mar 2021

Dynamic Neural Networks: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Gao Huang

Yulin Wang

625

863

09 Feb 2021

TDN: Temporal Difference Networks for Efficient Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2020

Limin Wang

Zhan Tong

Bin Ji

Gangshan Wu

609

477

18 Dec 2020

Recent Progress in Appearance-based Action Recognition

J. Humphreys

Zhe Chen

Dacheng Tao

222

25 Nov 2020

Actor and Action Modular Network for Text-based Video SegmentationIEEE Transactions on Image Processing (TIP), 2020

Liang Wang

335

02 Nov 2020

Deep Analysis of CNN-based Spatio-temporal Representations for Action Recognition

392

118

22 Oct 2020

Video Action Understanding

Matthew Hutchinson

V. Gadepally

414

13 Oct 2020

Approximated Bilinear Modules for Temporal ModelingIEEE International Conference on Computer Vision (ICCV), 2019

179

25 Jul 2020

AttentionNAS: Spatiotemporal Attention Cell Search for Video ClassificationEuropean Conference on Computer Vision (ECCV), 2020

358

23 Jul 2020

Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human Action Recognition

357

22 Jul 2020

Spatiotemporal Fusion in 3D CNNs: A Probabilistic ViewComputer Vision and Pattern Recognition (CVPR), 2020

212

10 Apr 2020

TEA: Temporal Excitation and Aggregation for Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2020

447

554

03 Apr 2020

STH: Spatio-Temporal Hybrid Convolution for Efficient Action Recognition

Kaihao Zhang

187

18 Mar 2020

Knowledge Integration Networks for Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2020

275

18 Feb 2020

Dynamic Inference: A New Approach Toward Efficient Video Action Recognition

Wenhao Wu

Dongliang He

Xiao Tan

Shifeng Chen

Yi Yang

Shilei Wen

201

09 Feb 2020

CTM: Collaborative Temporal Modeling for Action Recognition

131

08 Feb 2020

iqiyi Submission to ActivityNet Challenge 2019 Kinetics-700 challenge: Hierarchical Group-wise Attention

112

07 Feb 2020

TEINet: Towards an Efficient Architecture for Video RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2019

Zhaoyang Liu

Donghao Luo

Yabiao Wang

Limin Wang

Ying Tai

Chengjie Wang

212

267

21 Nov 2019

Multi-Label Classification with Label Graph SuperimposingAAAI Conference on Artificial Intelligence (AAAI), 2019

248

191

21 Nov 2019

STM: SpatioTemporal and Motion Encoding for Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2019

531

442

07 Aug 2019

Multi-Agent Reinforcement Learning Based Frame Sampling for Effective Untrimmed Video RecognitionIEEE International Conference on Computer Vision (ICCV), 2019

Wenhao Wu

Dongliang He

Xiao Tan

Shifeng Chen

Shilei Wen

266

134

31 Jul 2019

Only Time Can Tell: Discovering Temporal Data for Temporal ModelingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2019

381

19 Jul 2019

Towards Real-Time Action Recognition on Mobile Devices Using Deep Models

197

17 Jun 2019

Interaction-aware Spatio-temporal Pyramid Attention Networks for Action Classification

Bing Li

380

03 Aug 2018