Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

2 August 2016

Limin Wang

Yuanjun Xiong

Zhe Wang

Yu Qiao

Luc Van Gool

Papers citing "Temporal Segment Networks: Towards Good Practices for Deep Action Recognition"

50 / 1,449 papers shown

EgoLM: Multi-Modal Language Model of Egocentric MotionsComputer Vision and Pattern Recognition (CVPR), 2024

Fangzhou Hong

Vladimir Guzov

Ziwei Liu

178

26 Sep 2024

Deep Learning for Video Anomaly Detection: A Review

Peng Wang

Yanning Zhang

VLM AI4TS

221

09 Sep 2024

Self-Supervised Contrastive Learning for Videos using Differentiable Local Alignment

329

06 Sep 2024

GMFL-Net: A Global Multi-geometric Feature Learning Network for Repetitive Action Counting

289

31 Aug 2024

Joint Temporal Pooling for Improving Skeleton-based Action RecognitionInternational Conference on Digital Image Computing: Techniques and Applications (DICTA), 2023

Shanaka Ramesh Gunasekara

Wanqing Li

Jack Yang

P. Ogunbona

196

18 Aug 2024

Flatten: Video Action Recognition is an Image Classification task

Junlin Chen

249

17 Aug 2024

Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation ApproachEuropean Conference on Computer Vision (ECCV), 2024

Shizhou Zhang

Qingchun Yang

Yanning Zhang

209

14 Aug 2024

Dynamic and Compressive Adaptation of Transformers From Images to Videos

Limin Wang

459

13 Aug 2024

HAT: History-Augmented Anchor Transformer for Online Temporal Action LocalizationEuropean Conference on Computer Vision (ECCV), 2024

230

12 Aug 2024

Weakly Supervised Video Anomaly Detection and Localization with Spatio-Temporal PromptsACM Multimedia (MM), 2024

Peng Wang

Yanning Zhang

411

12 Aug 2024

FADE: A Dataset for Detecting Falling Objects around Buildings in VideoIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2024

418

11 Aug 2024

A Methodological and Structural Review of Hand Gesture Recognition Across Diverse Data ModalitiesIEEE Access (IEEE Access), 2024

247

10 Aug 2024

MU-MAE: Multimodal Masked Autoencoders-Based One-Shot LearningConference on Multimedia Information Processing and Retrieval (MIPR), 2024

Rex Liu

Xin Liu

267

08 Aug 2024

Online Temporal Action Localization with Memory-Augmented TransformerEuropean Conference on Computer Vision (ECCV), 2024

Youngkil Song

Dongkeun Kim

Minsu Cho

Suha Kwak

241

06 Aug 2024

RICA2: Rubric-Informed, Calibrated Assessment of ActionsEuropean Conference on Computer Vision (ECCV), 2024

Abrar Majeedi

Viswanatha Reddy Gajjala

Satya Sai Srinath Namburi Gnvv

Yin Li

CML

440

04 Aug 2024

Text-Guided Video Masked AutoencoderEuropean Conference on Computer Vision (ECCV), 2024

164

01 Aug 2024

Hyper-parameter tuning for text guided image editing

Shiwen Zhang

DiffM

226

31 Jul 2024

Start from Video-Music Retrieval: An Inter-Intra Modal Loss for Cross Modal Retrieval

230

28 Jul 2024

Is 3D Convolution with 5D Tensors Really Necessary for Video Analysis?

Habib Hajimolahoseini

Walid Ahmed

Austin Wen

Yang Liu

227

23 Jul 2024

SOAP: Enhancing Spatio-Temporal Relation and Motion Information Capturing for Few-Shot Action RecognitionACM Multimedia (MM), 2024

290

23 Jul 2024

A Comprehensive Review of Few-shot Action Recognition

538

20 Jul 2024

Pose-guided multi-task video transformer for driver action recognition

195

18 Jul 2024

ActionSwitch: Class-agnostic Detection of Simultaneous Actions in Streaming Videos

169

17 Jul 2024

Human-Centric Transformer for Domain Adaptive Action Recognition

Kun-Yu Lin

Jiaming Zhou

Wei-Shi Zheng

225

15 Jul 2024

Hypergraph Multi-modal Large Language Model: Exploiting EEG and Eye-tracking Modalities to Evaluate Heterogeneous Responses for Video Understanding

...

Ping Wang

323

11 Jul 2024

Towards Adaptive Pseudo-label Learning for Semi-Supervised Temporal Action Localization

Feixiang Zhou

Bryan M. Williams

Hossein Rahmani

209

10 Jul 2024

C2C: Component-to-Composition Learning for Zero-Shot Compositional Action Recognition

409

08 Jul 2024

DMSD-CDFSAR: Distillation from Mixed-Source Domain for Cross-Domain Few-shot Action Recognition

371

08 Jul 2024

MobilePortrait: Real-Time One-Shot Neural Head Avatars on Mobile Devices

401

08 Jul 2024

Computer Vision for Clinical Gait Analysis: A Gait Abnormality Video Dataset

Rahm Ranjan

David Ahmedt-Aristizabal

M. Armin

Juno Kim

245

05 Jul 2024

DyFADet: Dynamic Feature Aggregation for Temporal Action Detection

Shiji Song

Gao Huang

Fan Li

299

03 Jul 2024

SVFormer: A Direct Training Spiking Transformer for Efficient Video Action Recognition

Han Zhang

238

21 Jun 2024

Motion Consistency Model: Accelerating Video Diffusion with Disentangled Motion-Appearance Distillation

Yuanhao Zhai

Kevin Lin

Zhengyuan Yang

247

11 Jun 2024

SVASTIN: Sparse Video Adversarial Attack via Spatio-Temporal Invertible Neural Networks

196

04 Jun 2024

Object Aware Egocentric Online Action Detection

210

03 Jun 2024

RNNs, CNNs and Transformers in Human Action Recognition: A Survey and a Hybrid Model

293

02 Jun 2024

Flow-Assisted Motion Learning Network for Weakly-Supervised Group Activity Recognition

174

28 May 2024

MultiOOD: Scaling Out-of-Distribution Detection for Multiple Modalities

Olga Fink

218

27 May 2024

Flow Snapshot Neurons in Action: Deep Neural Networks Generalize to Biological Motion Perception

Shuangpeng Han

Ziyu Wang

Mengmi Zhang

275

26 May 2024

From CNNs to Transformers in Multimodal Human Action Recognition: A Survey

Muhammad Bilal Shaikh

Syed Mohammed Shamsul Islam

Douglas Chai

Naveed Akhtar

347

22 May 2024

OpenGait: A Comprehensive Benchmark Study for Gait Recognition towards Better PracticalityIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

316

15 May 2024

No Time to Waste: Squeeze Time into Channel for Mobile Video Understanding

225

14 May 2024

Deep video representation learning: a survey

217

10 May 2024

A Survey on Backbones for Deep Video Action Recognition

176

09 May 2024

Bidirectional Progressive Transformer for Interaction Intention AnticipationEuropean Conference on Computer Vision (ECCV), 2024

Yang Cao

325

09 May 2024

MVP-Shot: Multi-Velocity Progressive-Alignment Framework for Few-Shot Action RecognitionIEEE transactions on multimedia (IEEE TMM), 2024

Rui Yan

447

03 May 2024

Uncertainty-boosted Robust Video Activity Anticipation

292

29 Apr 2024

Movie101v2: Improved Movie Narration Benchmark

Qin Jin

297

20 Apr 2024

STAT: Towards Generalizable Temporal Action Localization

237

20 Apr 2024

On the Content Bias in Fréchet Video Distance

256

18 Apr 2024