TEA: Temporal Excitation and Aggregation for Action Recognition

Computer Vision and Pattern Recognition (CVPR), 2020

3 April 2020

Papers citing "TEA: Temporal Excitation and Aggregation for Action Recognition"

50 / 162 papers shown

Unleashing Temporal Capacity of Spiking Neural Networks through Spatiotemporal Separation

05 Dec 2025

GA2-CLIP: Generic Attribute Anchor for Efficient Prompt Tuningin Video-Language Models

166

27 Nov 2025

Towards an Effective Action-Region Tracking Framework for Fine-grained Video Action Recognition

264

26 Nov 2025

Smooth regularization for efficient video recognition

Gil Goldman

Raja Giryes

Mahadev Satyanarayanan

AI4TS

296

25 Nov 2025

A Renaissance of Explicit Motion Information Mining from Transformers for Action Recognition

261

21 Oct 2025

Watch Where You Move: Region-aware Dynamic Aggregation and Excitation for Gait RecognitionIEEE transactions on multimedia (TMM), 2025

185

18 Oct 2025

EDCFlow: Exploring Temporally Dense Difference Maps for Event-based Optical Flow EstimationComputer Vision and Pattern Recognition (CVPR), 2025

264

04 Jun 2025

Does Your Vision-Language Model Get Lost in the Long Video Sampling Dilemma?

1.1K

16 Mar 2025

Enhancing Video Understanding: Deep Neural Networks for Spatiotemporal Analysis

Amir Hosein Fadaei

M. Dehaqani

405

11 Feb 2025

Uni-AdaFocus: Spatial-temporal Dynamic Computation for Video RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

343

15 Dec 2024

Making Every Frame Matter: Continuous Activity Recognition in Streaming Video via Adaptive Video Context Modeling

Hao Wu

Yunxin Liu

Fengyuan Xu

667

19 Oct 2024

TDS-CLIP: Temporal Difference Side Network for Efficient VideoAction Recognition

218

20 Aug 2024

Dynamic and Compressive Adaptation of Transformers From Images to Videos

Limin Wang

520

13 Aug 2024

Is 3D Convolution with 5D Tensors Really Necessary for Video Analysis?

Habib Hajimolahoseini

Walid Ahmed

Austin Wen

Yang Liu

309

23 Jul 2024

C2C: Component-to-Composition Learning for Zero-Shot Compositional Action Recognition

474

08 Jul 2024

PosMLP-Video: Spatial and Temporal Relative Position Encoding for Efficient Video Recognition

304

03 Jul 2024

No Time to Waste: Squeeze Time into Channel for Mobile Video Understanding

287

14 May 2024

Learning Correlation Structures for Vision Transformers

368

05 Apr 2024

Don't Judge by the Look: Towards Motion Coherent Video RepresentationInternational Conference on Learning Representations (ICLR), 2024

Huan Wang

320

14 Mar 2024

M2-CLIP: A Multimodal, Multi-task Adapting Framework for Video Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2024

Mengmeng Wang

Jun Chen

Guang Dai

Jingdong Wang

Yong-Jin Liu

VLM

249

22 Jan 2024

F4D: Factorized 4D Convolutional Neural Network for Efficient Video-level Representation LearningInternational Conference on Agents and Artificial Intelligence (ICAART), 2023

193

28 Nov 2023

Semantic-aware Temporal Channel-wise Attention for Cardiac Function AssessmentIEEE International Symposium on Biomedical Imaging (ISBI), 2022

Guanqi Chen

Guanbin Li

110

09 Oct 2023

ZeroI2V: Zero-Cost Adaptation of Pre-trained Transformers from Image to VideoEuropean Conference on Computer Vision (ECCV), 2023

Xinhao Li

Yuhan Zhu

Limin Wang

VLM

356

02 Oct 2023

Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer LearningIEEE International Conference on Computer Vision (ICCV), 2023

266

14 Sep 2023

TransNet: A Transfer Learning-Based Network for Human Action RecognitionInternational Conference on Machine Learning and Applications (ICMLA), 2023

Khaled Alomar

Xiaohao Cai

324

13 Sep 2023

IndGIC: Supervised Action Recognition under Low Illumination

Jing-Teng Zeng

217

29 Aug 2023

Computation-efficient Deep Learning for Computer Vision: A Survey

Yulin Wang

Gao Huang

359

27 Aug 2023

Improving Video Violence Recognition with Human Interaction Learning on 3D Skeleton Point Clouds

Qingxin Xiao

Guosheng Lin

Qingyao Wu

3DH 3DPC

251

26 Aug 2023

MGMAE: Motion Guided Masking for Video Masked AutoencodingIEEE International Conference on Computer Vision (ICCV), 2023

Yu Qiao

265

21 Aug 2023

Orthogonal Temporal Interpolation for Zero-Shot Video RecognitionACM Multimedia (ACM MM), 2023

215

14 Aug 2023

Temporally-Adaptive Models for Efficient Video Understanding

Ziwei Liu

238

10 Aug 2023

Seeing in Flowing: Adapting CLIP for Action Recognition with Motion Prompts LearningACM Multimedia (ACM MM), 2023

231

09 Aug 2023

Prune Spatio-temporal Tokens by Semantic-aware Temporal AccumulationIEEE International Conference on Computer Vision (ICCV), 2023

246

08 Aug 2023

ViLP: Knowledge Exploration using Vision, Language, and Pose Embeddings for Video Action RecognitionIndian Conference on Computer Vision, Graphics & Image Processing (ICVGIP), 2023

S. Chaudhuri

Saumik Bhattacharya

212

07 Aug 2023

Sample Less, Learn More: Efficient Action Recognition via Frame Feature RestorationACM Multimedia (ACM MM), 2023

274

27 Jul 2023

What Can Simple Arithmetic Operations Do for Temporal Modeling?IEEE International Conference on Computer Vision (ICCV), 2023

Jingdong Wang

Wanli Ouyang

259

18 Jul 2023

Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

Syed Talal Wasim

Muhammad Uzair Khattak

Salman Khan

339

13 Jul 2023

Deep Neural Networks in Video Human Action Recognition: A Review

322

25 May 2023

VideoMAE V2: Scaling Video Masked Autoencoders with Dual MaskingComputer Vision and Pattern Recognition (CVPR), 2023

Yi Wang

Yu Qiao

496

623

29 Mar 2023

Frame Flexible NetworkComputer Vision and Pattern Recognition (CVPR), 2023

Huan Wang

248

26 Mar 2023

Multi-view knowledge distillation transformer for human action recognition

Yi Lin

Vincent S. Tseng

ViT

281

25 Mar 2023

Mutual Information-Based Temporal Difference Learning for Human Pose Estimation in VideoComputer Vision and Pattern Recognition (CVPR), 2023

449

15 Mar 2023

Maximizing Spatio-Temporal Entropy of Deep 3D CNNs for Efficient Video RecognitionInternational Conference on Learning Representations (ICLR), 2023

236

05 Mar 2023

Improving Zero-Shot Action Recognition using Human Instruction with Text Description

Na Wu

Hiroshi Kera

K. Kawamoto

267

21 Jan 2023

Bidirectional Cross-Modal Knowledge Exploration for Video Recognition with Pre-trained Vision-Language ModelsComputer Vision and Pattern Recognition (CVPR), 2022

Jingdong Wang

Wanli Ouyang

438

31 Dec 2022

An end-to-end multi-scale network for action prediction in videos

Xiaofan Liu

Jianqin Yin

Yuanxi Sun

Zhicheng Zhang

Jin Tang

226

31 Dec 2022

StepNet: Spatial-temporal Part-aware Network for Isolated Sign Language Recognition

422

25 Dec 2022

DroneAttention: Sparse Weighted Temporal Attention for Drone-Camera Based Activity RecognitionNeural Networks (NN), 2022

249

07 Dec 2022

VLG: General Video Recognition with Web Textual KnowledgeInternational Journal of Computer Vision (IJCV), 2022

380

03 Dec 2022

Video Test-Time Adaptation for Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2022

326

24 Nov 2022