Spatiotemporal Residual Networks for Video Action Recognition

7 November 2016

Christoph Feichtenhofer

A. Pinz

Richard P. Wildes

ArXiv (abs)PDF HTML

Papers citing "Spatiotemporal Residual Networks for Video Action Recognition"

50 / 273 papers shown

AR-Net: Adaptive Frame Resolution for Efficient Action RecognitionEuropean Conference on Computer Vision (ECCV), 2020

220

167

31 Jul 2020

Approximated Bilinear Modules for Temporal ModelingIEEE International Conference on Computer Vision (ICCV), 2019

124

25 Jul 2020

Depthwise Spatio-Temporal STFT Convolutional Neural Networks for Human Action Recognition

334

22 Jul 2020

MotionSqueeze: Neural Motion Feature Learning for Video Understanding

173

146

20 Jul 2020

Generalized Few-Shot Video Classification with Video Retrieval and Feature GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

Bernt Schiele

182

09 Jul 2020

Joint Learning of Social Groups, Individuals Action and Sub-group Activities in Videos

317

06 Jul 2020

SmallBigNet: Integrating Core and Contextual Views for Video Classification

Yu Qiao

205

103

25 Jun 2020

Comprehensive Information Integration Modeling Framework for Video TitlingKnowledge Discovery and Data Mining (KDD), 2020

Zhou Zhao

Jingren Zhou

Hongxia Yang

Leilei Gan

174

24 Jun 2020

Motion Representation Using Residual Frames with 3D CNN

135

21 Jun 2020

MS-TCN++: Multi-Stage Temporal Convolutional Network for Action Segmentation

Juergen Gall

222

16 Jun 2020

DTG-Net: Differentiated Teachers Guided Self-Supervised Video Action Recognition

176

13 Jun 2020

Action Recognition with Deep Multiple Aggregation Networks

A. Mazari

H. Sahbi

182

08 Jun 2020

Deep hierarchical pooling design for cross-granularity action recognition

A. Mazari

H. Sahbi

134

08 Jun 2020

Exploiting Inter-Frame Regional Correlation for Efficient Action RecognitionExpert systems with applications (ESWA), 2020

Yuecong Xu

117

06 May 2020

Rolling-Unrolling LSTMs for Action Anticipation from First-Person VideoIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

Antonino Furnari

G. Farinella

EgoV

249

166

04 May 2020

Asynchronous Interaction Aggregation for Action DetectionEuropean Conference on Computer Vision (ECCV), 2020

224

130

16 Apr 2020

Spatiotemporal Fusion in 3D CNNs: A Probabilistic ViewComputer Vision and Pattern Recognition (CVPR), 2020

166

10 Apr 2020

Spatial Priming for Detecting Human-Object Interactions

108

09 Apr 2020

X3D: Expanding Architectures for Efficient Video RecognitionComputer Vision and Pattern Recognition (CVPR), 2020

Christoph Feichtenhofer

421

1,226

09 Apr 2020

Temporal Accumulative Features for Sign Language Recognition

02 Apr 2020

Spatio-temporal Tubelet Feature Aggregation and Object Linking in Videos

124

01 Apr 2020

Combining detection and tracking for human pose estimation in videosComputer Vision and Pattern Recognition (CVPR), 2020

166

123

30 Mar 2020

Learning Object Permanence from VideoEuropean Conference on Computer Vision (ECCV), 2020

371

23 Mar 2020

Generative Multi-Stream Architecture For American Sign Language Recognition

09 Mar 2020

Motion-Attentive Transition for Zero-Shot Video Object SegmentationIEEE Transactions on Image Processing (TIP), 2020

429

211

09 Mar 2020

MoVi: A Large Multipurpose Motion and Video DatasetPLoS ONE (PLOS ONE), 2020

225

04 Mar 2020

Three-Stream Fusion Network for First-Person Interaction RecognitionPattern Recognition (Pattern Recognit.), 2020

Ye-ji Kim

Dong-Gyu Lee

Seong-Whan Lee

124

19 Feb 2020

Dynamic Inference: A New Approach Toward Efficient Video Action Recognition

Wenhao Wu

Dongliang He

Xiao Tan

Shifeng Chen

Yi Yang

Shilei Wen

158

09 Feb 2020

$Weakly-Supervised Multi-Person Action Recognition in 360$^{\circ}$ Videos$

Weakly-Supervised Multi-Person Action Recognition in 360

^{\circ}

VideosIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2020

229

09 Feb 2020

Learning Class Regularized Features for Action Recognition

Alexandros Stergiou

R. Poppe

R. Veltkamp

07 Feb 2020

Modality Compensation Network: Cross-Modal Adaptation for Action RecognitionIEEE Transactions on Image Processing (TIP), 2020

139

31 Jan 2020

Audiovisual SlowFast Networks for Video Recognition

Christoph Feichtenhofer

598

230

23 Jan 2020

Spatio-Temporal Ranked-Attention Networks for Video CaptioningIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2020

125

17 Jan 2020

Rethinking Motion Representation: Residual Frames with 3D ConvNets for Better Action RecognitionIEEE Transactions on Image Processing (TIP), 2020

142

16 Jan 2020

Self-supervising Action Recognition by Statistical Moment and Subspace DescriptorsACM Multimedia (ACM MM), 2020

Lei Wang

Piotr Koniusz

287

14 Jan 2020

Something-Else: Compositional Action Recognition with Spatial-Temporal Interaction NetworksComputer Vision and Pattern Recognition (CVPR), 2019

269

192

20 Dec 2019

Lower Dimensional Kernels for Video DiscriminatorsNeural Networks (NN), 2019

Emmanuel Kahembwe

S. Ramamoorthy

199

18 Dec 2019

Video action detection by learning graph-based spatio-temporal interactions

Lorenzo Baraldi

222

09 Dec 2019

VideoDG: Generalizing Temporal Relations in Videos to Novel DomainsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

Philip S. Yu

158

08 Dec 2019

A Multigrid Method for Efficiently Training Video ModelsComputer Vision and Pattern Recognition (CVPR), 2019

Chaoxia Wu

Ross B. Girshick

Kaiming He

Christoph Feichtenhofer

Philipp Krahenbuhl

301

02 Dec 2019

Gate-Shift Networks for Video Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2019

Swathikiran Sudhakaran

Sergio Escalera

Oswald Lanz

3DPC

316

172

01 Dec 2019

TEINet: Towards an Efficient Architecture for Video RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2019

Zhaoyang Liu

Donghao Luo

Yabiao Wang

Limin Wang

Ying Tai

Chengjie Wang

170

262

21 Nov 2019

STEP: Spatial Temporal Graph Convolutional Networks for Emotion Perception from GaitsAAAI Conference on Artificial Intelligence (AAAI), 2019

367

119

28 Oct 2019

Human Action Recognition with Multi-Laplacian Graph Convolutional Networks

A. Mazari

H. Sahbi

GNN

119

15 Oct 2019

CATER: A diagnostic dataset for Compositional Actions and TEmporal ReasoningInternational Conference on Learning Representations (ICLR), 2019

Rohit Girdhar

Deva Ramanan

385

193

10 Oct 2019

Learning Energy-based Spatial-Temporal Generative ConvNets for Dynamic PatternsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

178

26 Sep 2019

Discriminative Video Representation Learning Using Support Vector ClassifiersIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

Jue Wang

A. Cherian

05 Sep 2019

Cooperative Cross-Stream Network for Discriminative Action Representation

Jingran Zhang

Fumin Shen

Xing Xu

Heng Tao Shen

153

27 Aug 2019

Deep Concept-wise Temporal Convolutional Networks for Action LocalizationACM Multimedia (ACM MM), 2019

Chuang Gan

177

26 Aug 2019

STM: SpatioTemporal and Motion Encoding for Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2019

417

434

07 Aug 2019