STAR-Transformer: A Spatio-temporal Cross Attention Transformer for Human Action Recognition

IEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

14 October 2022

Papers citing "STAR-Transformer: A Spatio-temporal Cross Attention Transformer for Human Action Recognition"

36 / 36 papers shown

Heatmap Pooling Network for Action Recognition from RGB VideosIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

03 Dec 2025

Towards an Effective Action-Region Tracking Framework for Fine-grained Video Action Recognition

191

26 Nov 2025

T-MASK: Temporal Masking for Probing Foundation Models across Camera Views in Driver Monitoring

Thinesh Thiyakesan Ponbagavathi

Kunyu Peng

Alina Roitberg

204

22 Aug 2025

CarGait: Cross-Attention based Re-ranking for Gait recognition

282

01 Jul 2025

3D Skeleton-Based Action Recognition: A Review

245

01 Jun 2025

ADLGen: Synthesizing Symbolic, Event-Triggered Sensor Sequences for Human Activity Modeling

207

23 May 2025

Are Spatial-Temporal Graph Convolution Networks for Human Action Recognition Over-Parameterized?Computer Vision and Pattern Recognition (CVPR), 2025

254

15 May 2025

LongDiff: Training-Free Long Video Generation in One GoComputer Vision and Pattern Recognition (CVPR), 2025

244

23 Mar 2025

MoFM: A Large-Scale Human Motion Foundation Model

Mohammadreza Baharani

Ghazal Alinezhad Noghre

1.1K

08 Feb 2025

LS-HAR: Language Supervised Human Action Recognition with Salient Fusion, Construction Sites as a Use-Case

Mohammad Mahdavian

Mohammad Loni

Mo Chen

287

02 Oct 2024

Pose-Guided Fine-Grained Sign Language Video GenerationEuropean Conference on Computer Vision (ECCV), 2024

Wei Feng

336

25 Sep 2024

EPAM-Net: An Efficient Pose-driven Attention-guided Multimodal Network for Video Action Recognition

336

10 Aug 2024

Pose-guided multi-task video transformer for driver action recognition

195

18 Jul 2024

NODER: Image Sequence Regression Based on Neural Ordinary Differential Equations

Hao Bai

Yi Hong

3DH MedIm

160

18 Jul 2024

Expressive Keypoints for Skeleton-based Action Recognition via Skeleton Transformation

214

26 Jun 2024

RNNs, CNNs and Transformers in Human Action Recognition: A Survey and a Hybrid Model

294

02 Jun 2024

Multi-modal Mood Reader: Pre-trained Model Empowers Cross-Subject Emotion Recognition

Shuqiang Wang

169

28 May 2024

PitcherNet: Powering the Moneyball Evolution in Baseball Video Analytics

Yuhao Chen

155

13 May 2024

VG4D: Vision-Language Model Goes 4D Video Recognition

Xiangtai Li

202

17 Apr 2024

HumMUSS: Human Motion Understanding using State Space Models

Arnab Kumar Mondal

Stefano Alletto

Denis Tome

211

16 Apr 2024

Skeleton-Based Human Action Recognition with Noisy LabelsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024

Kailun Yang

209

15 Mar 2024

On the Utility of 3D Hand Poses for Action RecognitionEuropean Conference on Computer Vision (ECCV), 2024

Angela Yao

219

14 Mar 2024

Learning Causal Domain-Invariant Temporal Dynamics for Few-Shot Action Recognition

300

20 Feb 2024

Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment

Lei Wang

Jun Liu

Liang Zheng

Tom Gedeon

Piotr Koniusz

273

07 Feb 2024

SignVTCL: Multi-Modal Continuous Sign Language Recognition Enhanced by Visual-Textual Contrastive LearningBritish Machine Vision Conference (BMVC), 2024

Hao Chen

Ziyu Guo

Pheng-Ann Heng

260

22 Jan 2024

Explore Human Parsing Modality for Action RecognitionCAAI Transactions on Intelligence Technology (CAAI-TIT), 2024

200

04 Jan 2024

Just Add

π

! Pose Induced Video Transformers for Understanding Activities of Daily LivingComputer Vision and Pattern Recognition (CVPR), 2023

Dominick Reilly

Srijan Das

ViT

300

30 Nov 2023

Context-aware Session-based Recommendation with Graph Neural Networks

Zhihui Zhang

Jianxiang Yu

Xiang Li

218

14 Oct 2023

Position and Orientation-Aware One-Shot Learning for Medical Action Recognition from Signal DataIEEE transactions on multimedia (IEEE TMM), 2023

338

27 Sep 2023

A Survey on Image-text Multimodal Models

Ruifeng Guo

Jingxuan Wei

Linzhuang Sun

Khai-Nguyen Nguyen

Guiyong Chang

Dawei Liu

Sibo Zhang

Zhengbing Yao

Mingjun Xu

Liping Bu

VLM

328

23 Sep 2023

Unified Contrastive Fusion Transformer for Multimodal Human Action Recognition

Kyoung Ok Yang

Junho Koh

Jun-Won Choi

200

10 Sep 2023

Multi-stage Factorized Spatio-Temporal Representation for RGB-D Action and Gesture RecognitionACM Multimedia (ACM MM), 2023

258

23 Aug 2023

One-Shot Action Recognition via Multi-Scale Spatial-Temporal Skeleton MatchingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Jun Liu

295

14 Jul 2023

Multi-Dimensional Refinement Graph Convolutional Network with Robust Decouple Loss for Fine-Grained Skeleton-Based Action RecognitionIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

Gao Huang

142

27 Jun 2023

Towards Continual Egocentric Activity Recognition: A Multi-modal Egocentric Activity Dataset for Continual LearningIEEE transactions on multimedia (IEEE TMM), 2023

Linfeng Xu

Qingbo Wu

Fanman Meng

Shaoxu Cheng

165

26 Jan 2023

Cross-Modal Learning with 3D Deformable Attention for Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2022

327

12 Dec 2022