The Kinetics Human Action Video Dataset

19 May 2017

Sudheendra Vijayanarasimhan

Papers citing "The Kinetics Human Action Video Dataset"

50 / 2,152 papers shown

Video-based surgical skill assessment using 3D convolutional neural networksInternational Journal of Computer Assisted Radiology and Surgery (IJCARS), 2019

Isabel Funke

S. T. Mees

Jürgen Weitz

Stefanie Speidel

272

213

06 Mar 2019

KT-Speech-Crawler: Automatic Dataset Construction for Speech Recognition from YouTube VideosConference on Empirical Methods in Natural Language Processing (EMNLP), 2018

113

01 Mar 2019

STAR-Net: Action Recognition using Spatio-Temporal Activation ReprojectionCanadian Conference on Computer and Robot Vision (CRV), 2019

116

26 Feb 2019

Self-supervised Visual Feature Learning with Deep Neural Networks: A Survey

Longlong Jing

Yingli Tian

SSL

416

1,906

16 Feb 2019

Anomaly Locality in Video Surveillance

Federico Landi

Cees G. M. Snoek

Rita Cucchiara

127

29 Jan 2019

Spatio-temporal Action Recognition: A Survey

Amlaan Bhoi

27 Jan 2019

DistInit: Learning Video Representations Without a Single Labeled Video

198

26 Jan 2019

Audio-Visual Scene-Aware Dialog

...

Devi Parikh

277

213

25 Jan 2019

DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition

262

129

11 Jan 2019

Cricket stroke extraction: Towards creation of a large-scale cricket actions dataset

Arpan Gupta

S. Muthiah

113

10 Jan 2019

Mutual Context Network for Jointly Estimating Egocentric Gaze and Actions

Yifei Huang

Zhenqiang Li

Minjie Cai

Yoichi Sato

EgoV

276

07 Jan 2019

Action2Vec: A Crossmodal Embedding Approach to Action Learning

Meera Hahn

Andrew Silva

James M. Rehg

189

02 Jan 2019

Actor Conditioned Attention Maps for Video Action Detection

136

30 Dec 2018

Class-Aware Adversarial Lung Nodule Synthesis in CT Images

251

28 Dec 2018

D3D: Distilled 3D Networks for Video Action Recognition

183

179

19 Dec 2018

From FiLM to Video: Multi-turn Question Answering with Multi-modal Context

134

17 Dec 2018

Improving the Performance of Unimodal Dynamic Hand-Gesture Recognition with Multimodal Training

Mahdi Abavisani

Hamid Reza Vaezi Joze

Vishal M. Patel

228

148

14 Dec 2018

Adversarial Inference for Multi-Sentence Video Description

248

13 Dec 2018

Nrityantar: Pose oblivious Indian classical dance sequence classification system

V. Kaushik

Prerana Mukherjee

Brejesh Lall

13 Dec 2018

SlowFast Networks for Video Recognition

Christoph Feichtenhofer

Haoqi Fan

Jitendra Malik

Kaiming He

548

3,839

10 Dec 2018

Weakly Supervised Dense Event Captioning in Videos

Xuguang Duan

Wen-bing Huang

Chuang Gan

Jingdong Wang

Wenwu Zhu

Junzhou Huang

168

164

10 Dec 2018

Video Action Transformer Network

352

751

06 Dec 2018

Decompose to manipulate: Manipulable Object Synthesis in 3D Medical Images with Structured Image Decomposition

269

04 Dec 2018

The Visual Centrifuge: Model-Free Layered Video Representations

Jean-Baptiste Alayrac

João Carreira

Andrew Zisserman

180

04 Dec 2018

Timeception for Complex Action Recognition

Noureldien Hussein

E. Gavves

A. Smeulders

266

229

04 Dec 2018

Towards Accurate Generative Models of Video: A New Metric & Challenges

Thomas Unterthiner

Sjoerd van Steenkiste

789

1,032

03 Dec 2018

Multi-modal Capsule Routing for Actor and Action Video Segmentation Conditioned on Natural Language Queries

133

02 Dec 2018

Graph-Based Global Reasoning Networks

485

493

30 Nov 2018

Iterative Projection and Matching: Finding Structure-preserving Representatives and Its Application to Computer Vision

M. Joneidi

Alireza Zaeemzadeh

Nazanin Rahnavard

M. Shah

125

29 Nov 2018

Unsupervised Meta-Learning For Few-Shot Image Classification

230

156

28 Nov 2018

Self-Supervised Spatiotemporal Feature Learning via Video Rotation Prediction

191

165

28 Nov 2018

Uncertainty aware audiovisual activity recognition using deep Bayesian variational inference

182

27 Nov 2018

Evolving Space-Time Neural Architectures for Videos

179

26 Nov 2018

Stacked Spatio-Temporal Graph Convolutional Networks for Action Segmentation

344

26 Nov 2018

Temporal Bilinear Networks for Video Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2018

124

25 Nov 2018

RGB-D Based Action Recognition with Light-weight 3D Convolutional Networks

Peng Wang

Chunhua Shen

215

24 Nov 2018

Self-Supervised Video Representation Learning with Space-Time Cubic PuzzlesAAAI Conference on Artificial Intelligence (AAAI), 2018

Dahun Kim

Donghyeon Cho

In So Kweon

SSL

252

363

24 Nov 2018

Learning from Multiview Correlations in Open-Domain VideosIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2018

Pranava Madhyastha

134

21 Nov 2018

MAC: Mining Activity Concepts for Language-based Temporal LocalizationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2018

184

194

21 Nov 2018

TSM: Temporal Shift Module for Efficient Video UnderstandingIEEE International Conference on Computer Vision (ICCV), 2018

Ji Lin

Chuang Gan

Song Han

632

1,934

20 Nov 2018

Multi-Task Learning of Generalizable Representations for Video Action RecognitionIEEE International Conference on Multimedia and Expo (ICME), 2018

Philip S Yu

20 Nov 2018

Segregated Temporal Assembly Recurrent Networks for Weakly Supervised Multiple Action DetectionAAAI Conference on Artificial Intelligence (AAAI), 2018

222

19 Nov 2018

Recurrent Convolutions for Causal 3D CNNs

Gurkirt Singh

Fabio Cuzzolin

3DPC

131

17 Nov 2018

Natural Environment Benchmarks for Reinforcement Learning

183

14 Nov 2018

Skeleton-Based Action Recognition with Synchronous Local and Non-local Spatio-temporal Learning and Frequency Attention

Guyue Hu

Bo Cui

Shan Yu

229

10 Nov 2018

Identify, locate and separate: Audio-visual object extraction in large video collections using weak supervisionIEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA), 2018

119

09 Nov 2018

Cross and Learn: Cross-Modal Self-SupervisionGerman Conference on Pattern Recognition (DAGM), 2018

250

09 Nov 2018

Multimodal Grounding for Sequence-to-Sequence Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2018

149

09 Nov 2018

BAR: Bayesian Activity Recognition using variational inference

259

08 Nov 2018

Learning to Compose Topic-Aware Mixture of Experts for Zero-Shot Video CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2018

224

07 Nov 2018