Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

2 August 2016

Limin Wang

Yuanjun Xiong

Zhe Wang

Yu Qiao

Luc Van Gool

Papers citing "Temporal Segment Networks: Towards Good Practices for Deep Action Recognition"

50 / 1,449 papers shown

Spotting Temporally Precise, Fine-Grained Events in VideoEuropean Conference on Computer Vision (ECCV), 2022

327

20 Jul 2022

ViGAT: Bottom-up event recognition and explanation in video using factorized graph attention networkIEEE Access (IEEE Access), 2022

Nikolaos Gkalelis

Dimitrios Daskalakis

Vasileios Mezaris

204

20 Jul 2022

Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A SurveyACM Computing Surveys (ACM CSUR), 2022

Cigdem Beyan

Alessandro Vinciarelli

Alessio Del Bue

212

20 Jul 2022

Task-adaptive Spatial-Temporal Video Sampler for Few-shot Action RecognitionACM Multimedia (ACM MM), 2022

291

20 Jul 2022

Action Quality Assessment with Temporal Parsing TransformerEuropean Conference on Computer Vision (ECCV), 2022

Errui Ding

Jingdong Wang

167

19 Jul 2022

Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition

Jie Zhou

258

17 Jul 2022

Multimodal Open-Vocabulary Video Classification via Pre-Trained Vision and Language Models

182

15 Jul 2022

Semi-Supervised Temporal Action Detection with Proposal-Free MaskingEuropean Conference on Computer Vision (ECCV), 2022

148

14 Jul 2022

Forcing the Whole Video as Background: An Adversarial Learning Strategy for Weakly Temporal Action LocalizationACM Multimedia (ACM MM), 2022

203

14 Jul 2022

Proposal-Free Temporal Action Detection via Global Segmentation Mask LearningEuropean Conference on Computer Vision (ECCV), 2022

198

14 Jul 2022

Compound Prototype Matching for Few-shot Action RecognitionEuropean Conference on Computer Vision (ECCV), 2022

Yifei Huang

Lijin Yang

Yoichi Sato

364

12 Jul 2022

Robotic Detection of a Human-Comprehensible Gestural Language for Underwater Multi-Human-Robot CollaborationIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2022

Sadman Sakib Enan

Michael Fulton

Junaed Sattar

116

12 Jul 2022

Efficient Human Vision Inspired Action Recognition using Adaptive Spatiotemporal SamplingIEEE Transactions on Image Processing (IEEE TIP), 2022

282

12 Jul 2022

LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval

182

11 Jul 2022

1st Place Solution to the EPIC-Kitchens Action Anticipation Challenge 2022

Zeyu Jiang

Changxing Ding

EgoV

149

10 Jul 2022

Beyond Transfer Learning: Co-finetuning for Action Localisation

266

08 Jul 2022

VidConv: A modernized 2D ConvNet for Efficient Video Recognition

181

08 Jul 2022

Video-based Smoky Vehicle Detection with A Coarse-to-Fine Framework

Xiaojiang Peng

Xiaomao Fan

Q. Wu

Jieyan Zhao

Pan Gao

08 Jul 2022

MVP: Robust Multi-View Practice for Driving Action LocalizationInternational Conference on Information Systems and Computer Aided Education (ICISCAE), 2022

Jingjie Shang

Kunchang Li

Kaibin Tian

Haisheng Su

Yangguang Li

180

05 Jul 2022

TM2T: Stochastic and Tokenized Modeling for the Reciprocal Generation of 3D Human Motions and TextsEuropean Conference on Computer Vision (ECCV), 2022

464

344

04 Jul 2022

Large-scale Robustness Analysis of Video Action Recognition ModelsComputer Vision and Pattern Recognition (CVPR), 2022

Madeline Chantry Schiappa

280

04 Jul 2022

Continuous Sign Language Recognition via Temporal Super-Resolution NetworkThe Arabian journal for science and engineering (AJSE), 2022

137

03 Jul 2022

Skeleton-based Action Recognition via Adaptive Cross-Form LearningACM Multimedia (ACM MM), 2022

Xuanhan Wang

Yan Dai

Lianli Gao

Jingkuan Song

209

30 Jun 2022

Multi-Scale Spatial Temporal Graph Convolutional Network for Skeleton-Based Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2021

165

318

27 Jun 2022

Explore Spatio-temporal Aggregation for Insubstantial Object Detection: Benchmark Dataset and BaselineComputer Vision and Pattern Recognition (CVPR), 2022

Yibo Wang

Xun Cao

211

23 Jun 2022

Bi-Calibration Networks for Weakly-Supervised Video Representation LearningInternational Journal of Computer Vision (IJCV), 2022

Tao Mei

255

21 Jun 2022

Pyramid Region-based Slot Attention Network for Temporal Action Proposal GenerationBritish Machine Vision Conference (BMVC), 2022

Jun Hou

194

21 Jun 2022

Self-Supervised Learning for Videos: A SurveyACM Computing Surveys (ACM CSUR), 2022

Madeline Chantry Schiappa

Yogesh S Rawat

M. Shah

SSL

480

168

18 Jun 2022

Scalable Temporal Localization of Sensitive Activities in Movies and TV Episodes

Jingxiang Chen

206

16 Jun 2022

Human Eyes Inspired Recurrent Neural Networks are More Robust Against Adversarial NoisesNeural Computation (Neural Comput.), 2022

Minkyu Choi

Yizhen Zhang

Kuan Han

Xiaokai Wang

Zhongming Liu

AAML GAN

144

15 Jun 2022

It's Time for Artistic Correspondence in Music and VideoComputer Vision and Pattern Recognition (CVPR), 2022

Dídac Surís

Carl Vondrick

Bryan C. Russell

Justin Salamon

160

14 Jun 2022

Stand-Alone Inter-Frame Attention in Video ModelsComputer Vision and Pattern Recognition (CVPR), 2022

Yingwei Pan

Tao Mei

189

14 Jun 2022

Lost in Transmission: On the Impact of Networking Corruptions on Video Machine Learning Models

Trenton Chang

Daniel Y. Fu

115

10 Jun 2022

GateHUB: Gated History Unit with Background Suppression for Online Action DetectionComputer Vision and Pattern Recognition (CVPR), 2022

237

09 Jun 2022

PrivHAR: Recognizing Human Actions From Privacy-preserving LensEuropean Conference on Computer Vision (ECCV), 2022

255

08 Jun 2022

Revealing Single Frame Bias for Video-and-Language LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Jie Lei

Tamara L. Berg

Joey Tianyi Zhou

239

142

07 Jun 2022

Revisiting the "Video" in Video-Language UnderstandingComputer Vision and Pattern Recognition (CVPR), 2022

S. Buch

Cristobal Eyzaguirre

Adrien Gaidon

Jiajun Wu

L. Fei-Fei

Juan Carlos Niebles

216

202

03 Jun 2022

Future Transformer for Long-term Action AnticipationComputer Vision and Pattern Recognition (CVPR), 2022

Joonseok Lee

128

27 May 2022

PSTNet: Point Spatio-Temporal Convolution on Point Cloud SequencesInternational Conference on Learning Representations (ICLR), 2022

Hehe Fan

Yi Yang

333

133

27 May 2022

Learning What and Where: Disentangling Location and Identity Tracking Without SupervisionInternational Conference on Learning Representations (ICLR), 2022

404

26 May 2022

Learning Muti-expert Distribution Calibration for Long-tailed Video ClassificationIEEE transactions on multimedia (IEEE TMM), 2022

Yufan Hu

Junyu Gao

Changsheng Xu

119

22 May 2022

Structured Attention Composition for Temporal Action LocalizationIEEE Transactions on Image Processing (IEEE TIP), 2022

Le Yang

Junwei Han

Tao Zhao

Nian Liu

Dingwen Zhang

202

20 May 2022

A CLIP-Hitchhiker's Guide to Long Video Retrieval

422

17 May 2022

Representation Learning for Compressed Video Action Recognition via Attentive Cross-modal Interaction with Motion EnhancementInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

160

07 May 2022

BasicTAD: an Astounding RGB-Only Baseline for Temporal Action DetectionComputer Vision and Image Understanding (CVIU), 2022

287

05 May 2022

Unsupervised Domain Adaptation Learning for Hierarchical Infant Pose Recognition with Synthetic DataIEEE International Conference on Multimedia and Expo (ICME), 2022

Cheng-Yen Yang

Zhongyu Jiang

112

04 May 2022

In Defense of Image Pre-Training for Spatiotemporal RecognitionEuropean Conference on Computer Vision (ECCV), 2022

Jieru Mei

Cihang Xie

166

03 May 2022

Cross-modal Representation Learning for Zero-shot Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2022

Zicheng Liu

152

03 May 2022

CenterCLIP: Token Clustering for Efficient Text-Video RetrievalAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2022

203

152

02 May 2022

Tragedy Plus Time: Capturing Unintended Human Activities from Weakly-labeled Videos

Arnav Chakravarthy

Zhiyuan Fang

Yezhou Yang

154

28 Apr 2022