Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

2 August 2016

Limin Wang

Yuanjun Xiong

Zhe Wang

Yu Qiao

Luc Van Gool

Papers citing "Temporal Segment Networks: Towards Good Practices for Deep Action Recognition"

50 / 1,449 papers shown

Are current long-term video understanding datasets long-term?

Ombretta Strafforello

Klamer Schutte

Jan van Gemert

207

22 Aug 2023

Temporal-Distributed Backdoor Attack Against Video Based Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2023

391

21 Aug 2023

ResQ: Residual Quantization for Video PerceptionIEEE International Conference on Computer Vision (ICCV), 2023

221

18 Aug 2023

Boosting Few-shot Action Recognition with Graph-guided Hybrid MatchingIEEE International Conference on Computer Vision (ICCV), 2023

Mengmeng Wang

Jingdong Wang

207

18 Aug 2023

Unlimited Knowledge Distillation for Action Recognition in the Dark

Guosheng Lin

155

18 Aug 2023

Progression-Guided Temporal Action Detection in Videos

167

18 Aug 2023

Memory-and-Anticipation Transformer for Online Action UnderstandingIEEE International Conference on Computer Vision (ICCV), 2023

Yifei Huang

303

15 Aug 2023

ViGT: Proposal-free Video Grounding with Learnable Token in TransformerScience China Information Sciences (Sci China Inf Sci), 2023

Kun Li

Dan Guo

Meng Wang

ViT

156

11 Aug 2023

Temporally-Adaptive Models for Efficient Video Understanding

Ziwei Liu

205

10 Aug 2023

JEDI: Joint Expert Distillation in a Semi-Supervised Multi-Dataset Student-Teacher Scenario for Video Action Recognition

257

09 Aug 2023

View while Moving: Efficient Video Recognition in Long-untrimmed VideosACM Multimedia (ACM MM), 2023

Lanshan Zhang

Yang Liu

261

09 Aug 2023

Long-Distance Gesture Recognition using Dynamic Neural NetworksIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

191

09 Aug 2023

SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event based RecognitionIEEE Transactions on Cognitive and Developmental Systems (IEEE TCDS), 2023

369

08 Aug 2023

ViLP: Knowledge Exploration using Vision, Language, and Pose Embeddings for Video Action RecognitionIndian Conference on Computer Vision, Graphics & Image Processing (ICVGIP), 2023

S. Chaudhuri

Saumik Bhattacharya

175

07 Aug 2023

M$^3$Net: Multi-view Encoding, Matching, and Fusion for Few-shot
Fine-grained Action Recognition

^3

Net: Multi-view Encoding, Matching, and Fusion for Few-shot Fine-grained Action RecognitionACM Multimedia (ACM MM), 2023

Hao Tang

Jun Liu

Shuanglin Yan

Rui Yan

Zechao Li

Jinhui Tang

278

06 Aug 2023

Multimodal Adaptation of CLIP for Few-Shot Action RecognitionPattern Recognition (Pattern Recogn.), 2023

Mengmeng Wang

Jingdong Wang

181

03 Aug 2023

SkateboardAI: The Coolest Video Action Recognition for SkateboardingAAAI Conference on Artificial Intelligence (AAAI), 2023

Hanxiao Chen

ViT

118

02 Aug 2023

MAiVAR-T: Multimodal Audio-image and Video Action Recognizer using TransformersEuropean Workshop on Visual Information Processing (EUVIP), 2023

Muhammad Bilal Shaikh

Douglas Chai

Syed Mohammed Shamsul Islam

Naveed Akhtar

293

01 Aug 2023

Sample Less, Learn More: Efficient Action Recognition via Frame Feature RestorationACM Multimedia (ACM MM), 2023

220

27 Jul 2023

Unlocking the Emotional World of Visual Media: An Overview of the Science, Research, and Impact of Understanding EmotionProceedings of the IEEE (Proc. IEEE), 2023

338

25 Jul 2023

Spatiotemporal Modeling Encounters 3D Medical Image Analysis: Slice-Shift UNet with Multi-View FusionInternational Conference on Machine Vision and Applications (ICMVA), 2023

C. Ugwu

S. Casarin

Oswald Lanz

179

24 Jul 2023

In Defense of Clip-based Video Relation DetectionIEEE Transactions on Image Processing (IEEE TIP), 2023

Meng Wei

Long Chen

Wei Ji

Xiaoyu Yue

Roger Zimmermann

179

18 Jul 2023

What Can Simple Arithmetic Operations Do for Temporal Modeling?IEEE International Conference on Computer Vision (ICCV), 2023

Jingdong Wang

Wanli Ouyang

212

18 Jul 2023

Video-Mined Task Graphs for Keystep Recognition in Instructional VideosNeural Information Processing Systems (NeurIPS), 2023

Kumar Ashutosh

Santhosh Kumar Ramakrishnan

Triantafyllos Afouras

Kristen Grauman

299

17 Jul 2023

SkeletonMAE: Graph-based Masked Autoencoder for Skeleton Sequence Pre-trainingIEEE International Conference on Computer Vision (ICCV), 2023

279

17 Jul 2023

Multimodal Distillation for Egocentric Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

Gorjan Radevski

Dusan Grujicic

Marie-Francine Moens

Matthew Blaschko

Tinne Tuytelaars

EgoV

331

14 Jul 2023

RVD: A Handheld Device-Based Fundus Video Dataset for Retinal Vessel SegmentationNeural Information Processing Systems (NeurIPS), 2023

...

160

13 Jul 2023

VS-TransGRU: A Novel Transformer-GRU-based Framework Enhanced by Visual-Semantic Fusion for Egocentric Action Anticipation

159

08 Jul 2023

MAE-DFER: Efficient Masked Autoencoder for Self-supervised Dynamic Facial Expression RecognitionACM Multimedia (ACM MM), 2023

238

05 Jul 2023

Task-Specific Alignment and Multiple Level Transformer for Few-Shot Action RecognitionNeurocomputing (Neurocomputing), 2023

232

05 Jul 2023

Streaming egocentric action anticipation: An evaluation scheme and approachComputer Vision and Image Understanding (CVIU), 2023

Antonino Furnari

G. Farinella

EgoV

177

29 Jun 2023

Bullying10K: A Large-Scale Neuromorphic Dataset towards Privacy-Preserving Bullying RecognitionNeural Information Processing Systems (NeurIPS), 2023

Yi Zeng

185

20 Jun 2023

E2E-LOAD: End-to-End Long-form Online Action DetectionIEEE International Conference on Computer Vision (ICCV), 2023

216

13 Jun 2023

Enhanced Multimodal Representation Learning with Cross-modal KDComputer Vision and Pattern Recognition (CVPR), 2023

149

13 Jun 2023

Action Recognition with Multi-stream Motion Modeling and Mutual Information MaximizationInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

246

13 Jun 2023

Boosting Breast Ultrasound Video Classification by the Guidance of Keyframe Feature CentersInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2023

153

12 Jun 2023

Optimizing ViViT Training: Time and Memory Reduction for Action Recognition

182

07 Jun 2023

Atrial Septal Defect Detection in Children Based on Ultrasound Video Using Multiple Instances Learning

...

Jionglong Su

139

06 Jun 2023

Retrieval-Enhanced Visual Prompt Learning for Few-shot Classification

Hao Chen

194

04 Jun 2023

VideoComposer: Compositional Video Synthesis with Motion ControllabilityNeural Information Processing Systems (NeurIPS), 2023

Jingren Zhou

478

459

03 Jun 2023

VIPriors 3: Visual Inductive Priors for Data-Efficient Deep Learning Challenges

188

31 May 2023

Proposal-Based Multiple Instance Learning for Weakly-Supervised Temporal Action LocalizationComputer Vision and Pattern Recognition (CVPR), 2023

360

29 May 2023

Action Sensitivity Learning for Temporal Action LocalizationIEEE International Conference on Computer Vision (ICCV), 2023

331

25 May 2023

Cross-view Action Recognition Understanding From Exocentric to Egocentric PerspectiveNeurocomputing (Neurocomputing), 2023

Thanh-Dat Truong

Khoa Luu

EgoV

389

25 May 2023

TVTSv2: Learning Out-of-the-box Spatiotemporal Visual Representations at Scale

Ying Shan

275

23 May 2023

VideoLLM: Modeling Video Sequence with Large Language Models

Yifei Huang

...

Yi Wang

Yu Qiao

261

112

22 May 2023

Learning Higher-order Object Interactions for Keypoint-based Video Understanding

125

16 May 2023

Exploring Few-Shot Adaptation for Activity Recognition on Diverse Domains

Kailun Yang

335

15 May 2023

CEMFormer: Learning to Predict Driver Intentions from In-Cabin and External Cameras via Spatial-Temporal Transformers

Wenqian Ye

171

13 May 2023

Few-shot Action Recognition via Intra- and Inter-Video Information Maximization

225

10 May 2023