The Kinetics Human Action Video Dataset

19 May 2017

Sudheendra Vijayanarasimhan

Papers citing "The Kinetics Human Action Video Dataset"

50 / 2,152 papers shown

Meet JEANIE: a Similarity Measure for 3D Skeleton Sequences via Temporal-Viewpoint Alignment

Lei Wang

Jun Liu

Liang Zheng

Tom Gedeon

Piotr Koniusz

269

07 Feb 2024

Boosting Adversarial Transferability across Model Genus by Deformation-Constrained WarpingAAAI Conference on Artificial Intelligence (AAAI), 2024

Yuanbo Hou

268

06 Feb 2024

VLN-Video: Utilizing Driving Videos for Outdoor Vision-and-Language NavigationAAAI Conference on Artificial Intelligence (AAAI), 2024

Jialu Li

Aishwarya Padmakumar

Gaurav Sukhatme

Mohit Bansal

316

05 Feb 2024

Video-LaVIT: Unified Video-Language Pre-training with Decoupled Visual-Motional TokenizationInternational Conference on Machine Learning (ICML), 2024

Kun Xu

...

250

05 Feb 2024

Taylor Videos for Action RecognitionInternational Conference on Machine Learning (ICML), 2024

Lei Wang

Xiuyuan Yuan

Tom Gedeon

Liang Zheng

541

05 Feb 2024

Time-, Memory- and Parameter-Efficient Visual AdaptationComputer Vision and Pattern Recognition (CVPR), 2024

191

05 Feb 2024

Classification of Tennis Actions Using Deep Learning

Emil Hovad

Therese Hougaard-Jensen

L. H. Clemmensen

04 Feb 2024

Region-Based Representations Revisited

Michal Shlapentokh-Rothman

480

04 Feb 2024

NeuroCine: Decoding Vivid Video Sequences from Human Brain Activties

255

02 Feb 2024

A Survey on Generative AI and LLM for Video Generation, Understanding, and Streaming

Lin Wang

252

30 Jan 2024

Computer Vision for Primate Behavior Analysis in the Wild

...

400

29 Jan 2024

MV2MAE: Multi-View Video Masked Autoencoders

247

29 Jan 2024

Multi-model learning by sequential reading of untrimmed videos for action recognition

Kodai Kamiya

Toru Tamaki

255

26 Jan 2024

Multimodal Pathway: Improve Transformers with Irrelevant Data from Other ModalitiesComputer Vision and Pattern Recognition (CVPR), 2024

Ying Shan

309

25 Jan 2024

PanAf20K: A Large Video Dataset for Wild Ape Detection and Behaviour RecognitionInternational Journal of Computer Vision (IJCV), 2024

...

219

24 Jan 2024

Interleaving One-Class and Weakly-Supervised Models with Adaptive Thresholding for Unsupervised Video Anomaly DetectionEuropean Conference on Computer Vision (ECCV), 2024

263

24 Jan 2024

Deep Learning for Computer Vision based Activity Recognition and Fall Detection of the Elderly: a Systematic Review

F. X. Gaya-Morey

Cristina Manresa-Yee

Jose Maria Buades Rubio

163

22 Jan 2024

ActionHub: A Large-scale Action Video Description Dataset for Zero-shot Action Recognition

298

22 Jan 2024

M2-CLIP: A Multimodal, Multi-task Adapting Framework for Video Action RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2024

Mengmeng Wang

Jun Chen

Guang Dai

Jingdong Wang

Yong-Jin Liu

VLM

204

22 Jan 2024

Detecting Multimedia Generated by Large AI Models: A Survey

877

22 Jan 2024

Exploring Missing Modality in Multimodal Egocentric Datasets

299

21 Jan 2024

Adversarial Augmentation Training Makes Action Recognition Models More Robust to Realistic Video Distribution ShiftsInternational Conferences on Pattern Recognition and Artificial Intelligence (ICCPRAI), 2024

Kiyoon Kim

Shreyank N. Gowda

Panagiotis Eustratiadis

Antreas Antoniou

Robert B Fisher

362

21 Jan 2024

Deep Reinforcement Learning Empowered Activity-Aware Dynamic Health Monitoring Systems

Ziqiang Ye

Yulan Gao

Yue Xiao

Zehui Xiong

Dusit Niyato

19 Jan 2024

GPT4Ego: Unleashing the Potential of Pre-trained Models for Zero-Shot Egocentric Action Recognition

425

18 Jan 2024

Depth Over RGB: Automatic Evaluation of Open Surgery Skills Using Depth Camera

167

18 Jan 2024

From Coarse to Fine: Efficient Training for Audio Spectrogram TransformersIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

Jiu Feng

Mehmet Hamza Erol

Joon Son Chung

Arda Senocak

154

16 Jan 2024

Transformer-based Video Saliency Prediction with High Temporal Dimension Decoding

Morteza Moradi

S. Palazzo

C. Spampinato

191

15 Jan 2024

FiGCLIP: Fine-Grained CLIP Adaptation via Densely Annotated Videos

198

15 Jan 2024

Collaboratively Self-supervised Video Representation Learning for Action RecognitionIEEE Transactions on Information Forensics and Security (IEEE TIFS), 2024

375

15 Jan 2024

Hierarchical Augmentation and Distillation for Class Incremental Audio-Visual Video RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

320

11 Jan 2024

HaltingVT: Adaptive Token Halting Transformer for Efficient Video RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

225

10 Jan 2024

Dr$^2$Net: Dynamic Reversible Dual-Residual Networks for
Memory-Efficient Finetuning

^2

Net: Dynamic Reversible Dual-Residual Networks for Memory-Efficient FinetuningComputer Vision and Pattern Recognition (CVPR), 2024

Abdulmohsen Alghannam

Jitendra Malik

Guohao Li

229

08 Jan 2024

Efficient Multiscale Multimodal Bottleneck Transformer for Audio-Video Classification

Wentao Zhu

268

08 Jan 2024

Efficient Selective Audio Masked Multimodal Bottleneck Transformer for Audio-Video Classification

Wentao Zhu

154

08 Jan 2024

MERBench: A Unified Evaluation Benchmark for Multimodal Emotion Recognition

Zheng Lian

Guoying Zhao

Yong Ren

Hao Gu

406

07 Jan 2024

Efficient Bitrate Ladder Construction using Transfer Learning and Spatio-Temporal Features

A. Falahati

Mohammad Karim Safavi

153

06 Jan 2024

Subjective and Objective Analysis of Indian Social Media Video Quality

Sandeep Mishra

Mukul Jha

A. Bovik

206

05 Jan 2024

SAR-RARP50: Segmentation of surgical instrumentation and Action Recognition on Robot-Assisted Radical Prostatectomy Challenge

Dimitrios Psychogyios

Emanuele Colleoni

Beatrice van Amsterdam

Chih-Yang Li

Shu-Yu Huang

...

Santiago Rodriguez

Juanita Puentes

Pablo Arbelaez

Omid Mohareri

Danail Stoyanov

199

31 Dec 2023

Masked Modeling for Self-supervised Representation Learning on Vision and Beyond

Siyuan Li

Luyuan Zhang

Zedong Wang

Di Wu

Lirong Wu

...

Jun Xia

Cheng Tan

Yang Liu

Baigui Sun

Stan Z. Li

SSL

299

31 Dec 2023

A Large-Scale Re-identification Analysis in Sporting Scenarios: the Betrayal of Reaching a Critical Point

David Freire-Obregón

J. Lorenzo-Navarro

Oliverio J. Santana

Daniel Hernández-Sosa

Modesto Castrillón-Santana

CVBM

185

29 Dec 2023

Multiscale Vision Transformers meet Bipartite Matching for efficient single-stage Action LocalizationComputer Vision and Pattern Recognition (CVPR), 2023

Ioanna Ntinou

Enrique Sanchez

Georgios Tzimiropoulos

254

29 Dec 2023

Video Understanding with Large Language Models: A Survey

...

707

163

29 Dec 2023

3DTINC: Time-Equivariant Non-Contrastive Learning for Predicting Disease Progression from Longitudinal OCTs

...

245

28 Dec 2023

Deformable Audio Transformer for Audio Event Detection

Wentao Zhu

153

24 Dec 2023

Classifying Soccer Ball-on-Goal Position Through Kicker Shooting Action

Javier Torón-Artiles

Daniel Hernández-Sosa

Oliverio J. Santana

J. Lorenzo-Navarro

David Freire-Obregón

124

23 Dec 2023

Video Recognition in Portrait Mode

Mingfei Han

Linjie Yang

Xiaojie Jin

Jiashi Feng

Xiaojun Chang

Heng Wang

212

21 Dec 2023

Bootstrap Masked Visual Modeling via Hard Patches Mining

Xiangyu Zhang

227

21 Dec 2023

SADA: Semantic adversarial unsupervised domain adaptation for Temporal Action Localization

David Pujol-Perich

Albert Clapés

Sergio Escalera

620

20 Dec 2023

Collaborative Weakly Supervised Video Correlation Learning for Procedure-Aware Instructional Video Analysis

302

18 Dec 2023

Traffic Incident Database with Multiple Labels Including Various Perspective Environmental Information

Go Ohtani

165

17 Dec 2023