Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

2 August 2016

Limin Wang

Yuanjun Xiong

Zhe Wang

Yu Qiao

Luc Van Gool

Papers citing "Temporal Segment Networks: Towards Good Practices for Deep Action Recognition"

50 / 1,449 papers shown

Benchmarks for Physical Reasoning AI

355

17 Dec 2023

Video-based Surgical Skill Assessment using Tree-based Gaussian Process Classifier

207

15 Dec 2023

EZ-CLIP: Efficient Zeroshot Video Action Recognition

278

13 Dec 2023

LMDrive: Closed-Loop End-to-End Driving with Large Language ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Steven L. Waslander

310

238

12 Dec 2023

Attention Based Encoder Decoder Model for Video Captioning in Nepali (2023)

Kabita Parajuli

S. R. Joshi

278

12 Dec 2023

X4D-SceneFormer: Enhanced Scene Understanding on 4D Point Cloud Videos through Cross-modal Knowledge TransferAAAI Conference on Artificial Intelligence (AAAI), 2023

220

12 Dec 2023

Early Action Recognition with Action Prototypes

134

11 Dec 2023

Sense, Predict, Adapt, Repeat: A Blueprint for Design of New Adaptive AI-Centric Sensing Systems

S. Hor

Amin Arbabian

209

11 Dec 2023

A Decoupled Spatio-Temporal Framework for Skeleton-based Action Segmentation

Ming-Ming Cheng

202

10 Dec 2023

Hierarchical Spatio-temporal Decoupling for Text-to-Video Generation

211

07 Dec 2023

Low-power, Continuous Remote Behavioral Localization with Event Cameras

Friedhelm Hamann

Suman Ghosh

Ignacio Juarez Martinez

Tom Hart

Alex Kacelnik

Guillermo Gallego

195

06 Dec 2023

Towards More Practical Group Activity Detection: A New Benchmark and ModelEuropean Conference on Computer Vision (ECCV), 2023

201

05 Dec 2023

Adapting Short-Term Transformers for Action Detection in Untrimmed VideosComputer Vision and Pattern Recognition (CVPR), 2023

283

04 Dec 2023

Generating Action-conditioned Prompts for Open-vocabulary Video Action RecognitionACM Multimedia (ACM MM), 2023

Xiaojun Chang

Mengmeng Wang

Jingdong Wang

210

04 Dec 2023

$Consistency Prototype Module and Motion Compensation for Few-Shot Action Recognition (CLIP-CP$\mathbf{M^2}$C)$

Consistency Prototype Module and Motion Compensation for Few-Shot Action Recognition (CLIP-CP

\mathbf{M^2}

274

02 Dec 2023

OST: Refining Text Knowledge with Optimal Spatio-Temporal Descriptor for General Video RecognitionComputer Vision and Pattern Recognition (CVPR), 2023

386

30 Nov 2023

Source-free Video Domain Adaptation by Learning from Noisy LabelsPattern Recognition (Pattern Recogn.), 2023

498

30 Nov 2023

GeoDeformer: Geometric Deformable Transformer for Action Recognition

111

29 Nov 2023

MVBench: A Comprehensive Multi-modal Video Understanding BenchmarkComputer Vision and Pattern Recognition (CVPR), 2023

...

Ping Luo

Yu Qiao

668

857

28 Nov 2023

Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition

328

28 Nov 2023

Centre Stage: Centricity-based Audio-Visual Temporal Action Detection

Hanyuan Wang

Majid Mirmehdi

Dima Damen

Toby Perrett

187

28 Nov 2023

REACT: Recognize Every Action Everywhere All At OnceMachine Vision and Applications (MVA), 2023

213

27 Nov 2023

Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2023

295

27 Nov 2023

Introducing SSBD+ Dataset with a Convolutional Pipeline for detecting Self-Stimulatory Behaviours in Children using raw videosInternational Conference on e-Health Networking, Applications and Services (HealthCom), 2023

25 Nov 2023

Modality Mixer Exploiting Complementary Information for Multi-modal Action Recognition

254

21 Nov 2023

Unsupervised Video SummarizationAsian Conference on Computer Vision (ACCV), 2023

Hanqing Li

Diego Klabjan

J. Utke

158

07 Nov 2023

Dense Video Captioning: A Survey of Techniques, Datasets and Evaluation ProtocolsACM Computing Surveys (ACM Comput. Surv.), 2023

Iqra Qasim

Alexander Horsch

Dilip K. Prasad

255

05 Nov 2023

P-Age: Pexels Dataset for Robust Spatio-Temporal Apparent Age ClassificationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Abid Ali

Ashish Marisetty

François Brémond

185

04 Nov 2023

Beyond still images: Temporal features and input variance resilienceScientific Reports (Sci Rep), 2023

AmirHosein Fadaei

M. Dehaqani

271

01 Nov 2023

Diversifying Spatial-Temporal Perception for Video Domain GeneralizationNeural Information Processing Systems (NeurIPS), 2023

232

27 Oct 2023

Few-shot Action Recognition with Captioning Foundation Models

334

16 Oct 2023

Boundary Discretization and Reliable Classification Network for Temporal Action DetectionIEEE transactions on multimedia (IEEE TMM), 2023

Zhenying Fang

Jun Yu

Richang Hong

332

10 Oct 2023

Exploiting Facial Relationships and Feature Aggregation for Multi-Face Forgery DetectionIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2023

Chao Shen

128

07 Oct 2023

Multi-Resolution Audio-Visual Feature Fusion for Temporal Action Localization

Edward Fish

Jon Weinbren

Andrew Gilbert

166

05 Oct 2023

A Grammatical Compositional Model for Video Action Detection

Ying Wu

249

04 Oct 2023

ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to VideoEuropean Conference on Computer Vision (ECCV), 2023

Xinhao Li

Yuhan Zhu

Limin Wang

VLM

324

02 Oct 2023

A Survey on Deep Learning Techniques for Action Anticipation

304

29 Sep 2023

Training a Large Video Model on a Single Machine in a Day

Yue Zhao

Philipp Krahenbuhl

VLM

273

28 Sep 2023

CPR-Coach: Recognizing Composite Error Actions based on Single-class TrainingComputer Vision and Pattern Recognition (CVPR), 2023

Dingkang Yang

Xiao Zhao

Peng Zhai

Lihua Zhang

349

21 Sep 2023

SkeleTR: Towrads Skeleton-based Action Recognition in the Wild

249

20 Sep 2023

Collaborative Three-Stream Transformers for Video CaptioningComputer Vision and Image Understanding (CVIU), 2023

196

18 Sep 2023

Selective Volume Mixup for Video Action Recognition

Tao Mei

213

18 Sep 2023

Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer LearningIEEE International Conference on Computer Vision (ICCV), 2023

218

14 Sep 2023

Predicting Routine Object Usage for Proactive Robot AssistanceConference on Robot Learning (CoRL), 2023

258

12 Sep 2023

ATM: Action Temporality Modeling for Video Question AnsweringACM Multimedia (ACM MM), 2023

Junwen Chen

Jie Zhu

Yu Kong

216

05 Sep 2023

Towards Contrastive Learning in Music Video Domain

213

01 Sep 2023

Uncovering the Unseen: Discover Hidden Intentions by Micro-Behavior Graph ReasoningACM Multimedia (ACM MM), 2023

Zheng Wang

209

29 Aug 2023

UMMAFormer: A Universal Multimodal-adaptive Transformer Framework for Temporal Forgery LocalizationACM Multimedia (ACM MM), 2023

255

28 Aug 2023

Improving Video Violence Recognition with Human Interaction Learning on 3D Skeleton Point Clouds

Qingxin Xiao

Guosheng Lin

Qingyao Wu

3DH 3DPC

197

26 Aug 2023

Learning from Semantic Alignment between Unpaired Multiviews for Egocentric Video RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

370

22 Aug 2023