Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?

10 April 2020

Papers citing "Would Mega-scale Datasets Further Enhance Spatiotemporal 3D CNNs?"

30 / 30 papers shown

ERDES: A Benchmark Video Dataset for Retinal Detachment and Macular Status Classification in Ocular Ultrasound

05 Aug 2025

Physics-Guided Motion Loss for Video Generation Model

251

02 Jun 2025

Measuring Error Alignment for Decision-Making SystemsAAAI Conference on Artificial Intelligence (AAAI), 2024

476

03 Jan 2025

Traffic Incident Database with Multiple Labels Including Various Perspective Environmental Information

Go Ohtani

198

17 Dec 2023

QAFE-Net: Quality Assessment of Facial Expressions with Landmark Heatmaps

Shuchao Duan

Amirhossein Dadashzadeh

Alan Whone

Majid Mirmehdi

CVBM

408

01 Dec 2023

FireMatch: A Semi-Supervised Video Fire Detection Network Based on Consistency and Distribution Alignment

226

09 Nov 2023

Subtle Signals: Video-based Detection of Infant Non-nutritive Sucking as a Neurodevelopmental Cue

Shaotong Zhu

Michael Wan

Sai Kumar Reddy Manne

Emily B. Zimmerman

Sarah Ostadabbas

178

24 Oct 2023

Chop & Learn: Recognizing and Generating Object-State CompositionsIEEE International Conference on Computer Vision (ICCV), 2023

318

25 Sep 2023

Multimodal Distillation for Egocentric Action RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

Gorjan Radevski

Dusan Grujicic

Marie-Francine Moens

Matthew Blaschko

Tinne Tuytelaars

EgoV

407

14 Jul 2023

Anatomically aware dual-hop learning for pulmonary embolism detection in CT pulmonary angiograms

Florin Condrea

S. Rapaka

Lucian Itu

Puneet Sharma

J. Sperl

Mohamed Ali

Marius Leordeanu

178

30 Mar 2023

Hand Gestures Recognition in Videos Taken with Lensless CameraOptics Express (OE), 2022

197

15 Oct 2022

Adaptive occlusion sensitivity analysis for visually explaining video recognition networks

357

26 Jul 2022

Analysis and Extensions of Adversarial Training for Video Classification

K. A. Kinfu

René Vidal

AAML

271

16 Jun 2022

Deep Neural Network approaches for Analysing Videos of Music Performances

F. Liwicki

Richa Upadhyay

Prakash Chandra Chhipa

186

05 May 2022

On Negative Sampling for Audio-Visual Contrastive Learning from Movies

210

29 Apr 2022

Learning from Temporal Gradient for Semi-supervised Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2021

Zongwei Zhou

293

25 Nov 2021

Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in Artificial Intelligence

...

Carola-Bibiane Schönlieb

Tian Xia

FedML

147

18 Nov 2021

Unsupervised Action Localization Crop in Video Retargeting for 3D ConvNetsIEEE Region 10 Conference (TENCON), 2021

Prithwish Jana

Swarnabja Bhaumik

Partha Pratim Mohanta

199

14 Nov 2021

Revisiting spatio-temporal layouts for compositional action recognitionBritish Machine Vision Conference (BMVC), 2021

Gorjan Radevski

Marie-Francine Moens

Tinne Tuytelaars

278

02 Nov 2021

AdaPool: Exponential Adaptive Pooling for Information-Retaining DownsamplingIEEE Transactions on Image Processing (TIP), 2021

Alexandros Stergiou

R. Poppe

345

141

01 Nov 2021

Sign Language Recognition via Skeleton-Aware Multi-Model Ensemble

278

12 Oct 2021

PIP: Physical Interaction Prediction via Mental Simulation with Span SelectionEuropean Conference on Computer Vision (ECCV), 2021

Cheston Tan

335

10 Sep 2021

VidLanKD: Improving Language Understanding via Video-Distilled Knowledge Transfer

271

06 Jul 2021

Watching Too Much Television is Good: Self-Supervised Audio-Visual Representation Learning from Movies and TV Shows

140

16 Jun 2021

Skimming and Scanning for Untrimmed Video Action Recognition

Ailing Zeng

211

21 Apr 2021

Skeleton Aware Multi-modal Sign Language Recognition

314

252

16 Mar 2021

TCLR: Temporal Contrastive Learning for Video RepresentationComputer Vision and Image Understanding (CVIU), 2021

Mubarak Shah

475

220

20 Jan 2021

Refining activation downsampling with SoftPoolIEEE International Conference on Computer Vision (ICCV), 2021

Alexandros Stergiou

R. Poppe

Grigorios Kalliatakis

392

194

02 Jan 2021

Multi-Temporal Convolutions for Human Action Recognition in Videos

Alexandros Stergiou

R. Poppe

247

08 Nov 2020

Actor-Action Video Classification CSC 249/449 Spring 2020 Challenge Report

Jing Shi

...

179

01 Aug 2020