v1v2 (latest)

Two-Stream Convolutional Networks for Action Recognition in Videos

Neural Information Processing Systems (NeurIPS), 2014

9 June 2014

Karen Simonyan

Andrew Zisserman

ArXiv (abs)PDF HTML

Papers citing "Two-Stream Convolutional Networks for Action Recognition in Videos"

50 / 2,340 papers shown

Towards Adaptive Fusion of Multimodal Deep Networks for Human Action Recognition

Novanto Yudistira

140

04 Dec 2025

Video Diffusion Models Excel at Tracking Similar-Looking Objects Without Supervision

231

02 Dec 2025

Generative Action Tell-Tales: Assessing Human Motion in Synthesized Videos

316

01 Dec 2025

Beyond Real versus Fake Towards Intent-Aware Video Analysis

27 Nov 2025

Towards an Effective Action-Region Tracking Framework for Fine-grained Video Action Recognition

190

26 Nov 2025

Smooth regularization for efficient video recognition

Gil Goldman

Raja Giryes

Mahadev Satyanarayanan

AI4TS

204

25 Nov 2025

Auto-US: An Ultrasound Video Diagnosis Agent Using Video Classification Framework and LLMs

116

11 Nov 2025

Grounding Foundational Vision Models with 3D Human Poses for Robust Action Recognition

111

06 Nov 2025

Disentangled Concepts Speak Louder Than Words: Explainable Video Action Recognition

145

05 Nov 2025

A Lightweight 3D-CNN for Event-Based Human Action Recognition with Privacy-Preserving Potential

Mehdi Sefidgar Dilmaghani

Francis Fowley

Peter Corcoran

135

05 Nov 2025

M3PD Dataset: Dual-view Photoplethysmography (PPG) Using Front-and-rear Cameras of Smartphones in Lab and Clinical Settings

...

220

04 Nov 2025

FLoC: Facility Location-Based Efficient Visual Token Compression for Long Video Understanding

31 Oct 2025

A Renaissance of Explicit Motion Information Mining from Transformers for Action Recognition

199

21 Oct 2025

MAVR-Net: Robust Multi-View Learning for MAV Action Recognition with Cross-View Attention

Nengbo Zhang

Hann Woei Ho

148

17 Oct 2025

Learning to Recognize Correctly Completed Procedure Steps in Egocentric Assembly Videos through Spatio-Temporal ModelingComputer Vision and Image Understanding (CVIU), 2025

120

14 Oct 2025

Two-stream network-driven vision-based tactile sensor for object feature extraction and fusion perception

112

14 Oct 2025

Mixup Helps Understanding Multimodal Video Better

Xiaoyu Ma

Ding Ding

Hao Chen

124

13 Oct 2025

SAM2-3dMed: Empowering SAM2 for 3D Medical Image Segmentation

10 Oct 2025

Q-Router: Agentic Video Quality Assessment with Expert Model Routing and Artifact Localization

179

09 Oct 2025

Flow4Agent: Long-form Video Understanding via Motion Prior from Optical Flow

07 Oct 2025

REALIGN: Regularized Procedure Alignment with Matching Video Embeddings via Partial Gromov-Wasserstein Optimal Transport

Soumyadeep Chandra

Kaushik Roy

130

29 Sep 2025

Prompt-guided Disentangled Representation for Action Recognition

226

26 Sep 2025

Temporal vs. Spatial: Comparing DINOv3 and V-JEPA2 Feature Representations for Video Action Analysis

Sai Varun Kodathala

Rakesh Vunnam

129

25 Sep 2025

Six Sigma For Neural Networks: Taguchi-based optimization

Sai Varun Kodathala

104

22 Sep 2025

MoCrop: Training Free Motion Guided Cropping for Efficient Video Action Recognition

22 Sep 2025

MoCLIP-Lite: Efficient Video Recognition by Fusing CLIP with Motion Vectors

119

21 Sep 2025

LSTC-MDA: A Unified Framework for Long-Short Term Temporal Convolution and Mixed Data Augmentation in Skeleton-Based Action Recognition

18 Sep 2025

Vi-SAFE: A Spatial-Temporal Framework for Efficient Violence Detection in Public Surveillance

16 Sep 2025

Enhancing Video Large Language Models with Structured Multi-Video Collaborative Reasoning

200

16 Sep 2025

Video Understanding by Design: How Datasets Shape Architectures and Insights

237

11 Sep 2025

Dual-Model Weight Selection and Self-Knowledge Distillation for Medical Image Classification

108

28 Aug 2025

A Novel Deep Hybrid Framework with Ensemble-Based Feature Optimization for Robust Real-Time Human Activity Recognition

Wasi Ullah

Yasir Noman Khalid

Saddam Hussain Khan

162

26 Aug 2025

Why Relational Graphs Will Save the Next Generation of Vision Foundation Models?Social Science Research Network (SSRN), 2025

Fatemeh Ziaeetabar

117

25 Aug 2025

Aligning Moments in Time using Video Queries

279

21 Aug 2025

Generative Model-Based Feature Attention Module for Video Action Analysis

120

19 Aug 2025

ESSENTIAL: Episodic and Semantic Memory Integration for Video Class-Incremental Learning

180

14 Aug 2025

Trokens: Semantic-Aware Relational Trajectory Tokens for Few-Shot Action Recognition

186

05 Aug 2025

VLM4D: Towards Spatiotemporal Awareness in Vision Language Models

185

04 Aug 2025

Efficient Spatial-Temporal Modeling for Real-Time Video Analysis: A Unified Framework for Action Recognition and Object Tracking

Shahla John

123

30 Jul 2025

Dual Guidance Semi-Supervised Action Detection

166

28 Jul 2025

HumanSAM: Classifying Human-centric Forgery Videos in Human Spatial, Appearance, and Motion Anomaly

243

26 Jul 2025

SPACT18: Spiking Human Action Recognition Benchmark Dataset with Complementary RGB and Thermal Modalities

146

22 Jul 2025

Procedure Learning via Regularized Gromov-Wasserstein Optimal Transport

172

21 Jul 2025

DynImg: Key Frames with Visual Prompts are Good Representation for Multi-Modal Video Understanding

147

21 Jul 2025

Large Language Models for Crash Detection in Video: A Survey of Methods, Datasets, and Challenges

300

02 Jul 2025

Zero-Shot Skeleton-Based Action Recognition With Prototype-Guided Feature AlignmentIEEE Transactions on Image Processing (IEEE TIP), 2025

235

01 Jul 2025

^2

ST-Adapter: Disentangled-and-Deformable Spatio-Temporal Adapter for Few-shot Action Recognition

492

01 Jul 2025

ActAlign: Zero-Shot Fine-Grained Video Classification via Language-Guided Sequence Alignment

287

28 Jun 2025

Language-driven Description Generation and Common Sense Reasoning for Video Action Recognition

167

20 Jun 2025

An Effective End-to-End Solution for Multimodal Action RecognitionInternational Conference on Pattern Recognition (ICPR), 2025

234

11 Jun 2025