v1v2 (latest)

Two-Stream Convolutional Networks for Action Recognition in Videos

Neural Information Processing Systems (NeurIPS), 2014

9 June 2014

Karen Simonyan

Andrew Zisserman

ArXiv (abs)PDF HTML

Papers citing "Two-Stream Convolutional Networks for Action Recognition in Videos"

50 / 2,340 papers shown

Bidirectional Multirate Reconstruction for Temporal Modeling in Videos

Linchao Zhu

Zhongwen Xu

Yi Yang

158

28 Nov 2016

Online Real-time Multiple Spatiotemporal Action Localisation and Prediction

429

299

25 Nov 2016

AdaScan: Adaptive Scan Pooling in Deep Convolutional Neural Networks for Human Action Recognition in Videos

298

157

24 Nov 2016

Multi-Modality Fusion based on Consensus-Voting and 3D Convolution for Isolated Gesture Recognition

Stan Z. Li

150

21 Nov 2016

Deep Temporal Linear Encoding Networks

Ali Diba

Vivek Sharma

Luc Van Gool

144

238

21 Nov 2016

Temporal Generative Adversarial Nets with Singular Value Clipping

245

485

21 Nov 2016

Deep Tensor Convolution on Multicores

David Budden

185

20 Nov 2016

An End-to-End Spatio-Temporal Attention Model for Human Action Recognition from Skeleton Data

363

1,031

18 Nov 2016

Deep Action- and Context-Aware Sequence Learning for Activity Recognition and Anticipation

Mohammad Sadegh Ali Akbarian

137

17 Nov 2016

Temporal Convolutional Networks for Action Segmentation and Detection

307

1,809

16 Nov 2016

Learning long-term dependencies for action recognition with a biologically-inspired deep network

Yemin Shi

Yonghong Tian

Yaowei Wang

Tiejun Huang

194

16 Nov 2016

Joint Network based Attention for Action Recognition

Yemin Shi

Yonghong Tian

Yaowei Wang

Tiejun Huang

104

16 Nov 2016

Multispectral Deep Neural Networks for Pedestrian Detection

169

412

08 Nov 2016

Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks

296

373

08 Nov 2016

Spatiotemporal Residual Networks for Video Action Recognition

Christoph Feichtenhofer

A. Pinz

Richard P. Wildes

353

740

07 Nov 2016

Exploiting Spatio-Temporal Structure with Recurrent Winner-Take-All Networks

403

31 Oct 2016

Real-time Online Action Detection Forests using Spatio-temporal Contexts

Seungryul Baek

K. Kim

Tae-Kyun Kim

149

28 Oct 2016

Review of Action Recognition and Detection Methods

Soo-Min Kang

Richard P. Wildes

183

21 Oct 2016

ARTiS: Appearance-based Action Recognition in Task Space for Real-Time Human-Robot Collaboration

M. Eich

S. Shirazi

G. Wyeth

137

18 Oct 2016

Semi-Coupled Two-Stream Fusion ConvNets for Action Recognition at Extremely Low ResolutionsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2016

Jiawei Chen

Jonathan Wu

Janusz Konrad

Prakash Ishwar

203

12 Oct 2016

Egocentric Height EstimationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2016

09 Oct 2016

Weakly supervised learning of actions from transcriptsComputer Vision and Image Understanding (CVIU), 2016

Hilde Kuehne

Alexander Richard

Juergen Gall

261

125

07 Oct 2016

Visual Question Answering: Datasets, Algorithms, and Future ChallengesComputer Vision and Image Understanding (CVIU), 2016

Kushal Kafle

Christopher Kanan

OOD

259

257

05 Oct 2016

Learning Language-Visual Embedding for Movie Understanding with Natural-Language

Atousa Torabi

Niket Tandon

Leonid Sigal

154

106

26 Sep 2016

Deep Learning for Video Classification and Captioning

Zuxuan Wu

185

139

22 Sep 2016

Deep CTR Prediction in Display Advertising

Hao Li

234

142

20 Sep 2016

Pose from Action: Unsupervised Learning of Pose Features based on Motion

Senthil Purushwalkam

Abhinav Gupta

SSL

140

18 Sep 2016

GeThR-Net: A Generalized Temporally Hybrid Recurrent Neural Network for Multimodal Information Fusion

17 Sep 2016

Combining Texture and Shape Cues for Object Recognition With Minimal Supervision

Xingchao Peng

Kate Saenko

3DPC

14 Sep 2016

Using Spatial Pooler of Hierarchical Temporal Memory to classify noisy videos with predefined complexity

Maciej Wielgosz

Marcin Pietroñ

10 Sep 2016

Sequential Deep Trajectory Descriptor for Action Recognition with Three-stream CNN

Yemin Shi

Yonghong Tian

Yaowei Wang

Tiejun Huang

143

199

10 Sep 2016

Generating Videos with Scene Dynamics

Carl Vondrick

Hamed Pirsiavash

Antonio Torralba

GAN VGen

482

1,550

08 Sep 2016

Making a Case for Learning Motion Representations with Phase

S. Pintea

Jan van Gemert

117

06 Sep 2016

Deep-Anomaly: Fully Convolutional Neural Network for Fast Anomaly Detection in Crowded Scenes

217

455

03 Sep 2016

Transferring Object-Scene Convolutional Neural Networks for Event Recognition in Still Images

Limin Wang

Zhe Wang

Yu Qiao

Luc Van Gool

159

01 Sep 2016

Efficient Two-Stream Motion and Appearance 3D CNNs for Video Classification

Ali Diba

A. Pazandeh

Luc Van Gool

176

31 Aug 2016

What makes ImageNet good for transfer learning?

364

699

30 Aug 2016

Human Action Recognition without Human

182

29 Aug 2016

Sympathy for the Details: Dense Trajectories and Hybrid Classification Architectures for Action RecognitionEuropean Conference on Computer Vision (ECCV), 2016

César Roberto de Souza

Adrien Gaidon

E. Vig

A. Peña

119

25 Aug 2016

Searching Action Proposals via Spatial Actionness Estimation and Temporal Path Inference and TrackingAsian Conference on Computer Vision (ACCV), 2016

Dan Xu

114

23 Aug 2016

Large-scale Continuous Gesture Recognition Using Convolutional Neural NetworksInternational Conference on Pattern Recognition (ICPR), 2016

243

22 Aug 2016

STFCN: Spatio-Temporal FCN for Semantic Video Segmentation

225

21 Aug 2016

Leveraging Structural Context Models and Ranking Score Fusion for Human Interaction PredictionIEEE transactions on multimedia (TMM), 2016

226

18 Aug 2016

Depth2Action: Exploring Embedded Depth for Large-Scale Action Recognition

Yi Zhu

Shawn D. Newsam

136

15 Aug 2016

About Pyramid Structure in Convolutional Neural Networks

I. Ullah

A. Petrosino

3DV

210

14 Aug 2016

Discriminatively Trained Latent Ordinal Model for Video Classification

Karan Sikka

Gaurav Sharma

179

08 Aug 2016

Signs in time: Encoding human motion as a temporal image

Joon Son Chung

Andrew Zisserman

SLR

120

06 Aug 2016

Fusing Deep Convolutional Networks for Large Scale Visual Concept Classification

H. Ergun

M. Sert

05 Aug 2016

Deep Learning for Detecting Multiple Space-Time Action Tubes in Videos

230

213

04 Aug 2016

Modeling Spatial and Temporal Cues for Multi-label Facial Action Unit Detection

Wen-Sheng Chu

Fernando de la Torre

J. Cohn

138

02 Aug 2016