v1v2 (latest)

Long-Term Feature Banks for Detailed Video Understanding

12 December 2018

Chao-Yuan Wu

Christoph Feichtenhofer

Papers citing "Long-Term Feature Banks for Detailed Video Understanding"

50 / 315 papers shown

Source-free Video Domain Adaptation by Learning from Noisy LabelsPattern Recognition (Pattern Recogn.), 2023

501

30 Nov 2023

Spacewalk-18: A Benchmark for Multimodal and Long-form Procedural Video Understanding in Novel Domains

500

30 Nov 2023

Towards Weakly Supervised End-to-end Learning for Long-video Action Recognition

328

28 Nov 2023

Query by Activity Video in the WildInternational Conference on Information Photonics (ICIP), 2023

223

23 Nov 2023

Event Causality Is Key to Computational Story Understanding

Yidan Sun

Qin Chao

Boyang Albert Li

326

16 Nov 2023

Beyond still images: Temporal features and input variance resilienceScientific Reports (Sci Rep), 2023

AmirHosein Fadaei

M. Dehaqani

272

01 Nov 2023

Object-centric Video Representation for Long-term Action AnticipationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Shijie Wang

280

31 Oct 2023

ChimpACT: A Longitudinal Dataset for Understanding Chimpanzee BehaviorsNeural Information Processing Systems (NeurIPS), 2023

230

25 Oct 2023

Flow Dynamics Correction for Action Recognition

Lei Wang

Piotr Koniusz

255

16 Oct 2023

A Grammatical Compositional Model for Video Action Detection

Ying Wu

249

04 Oct 2023

A Survey on Deep Learning Techniques for Action Anticipation

304

29 Sep 2023

SkeleTR: Towrads Skeleton-based Action Recognition in the Wild

249

20 Sep 2023

JOADAA: joint online action detection and action anticipationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

178

12 Sep 2023

Object-Centric Multiple Object TrackingIEEE International Conference on Computer Vision (ICCV), 2023

Zixu Zhao

...

Bernt Schiele

Yanwei Fu

Francesco Locatello

Zheng Zhang

Tianjun Xiao

VOT OCL

351

01 Sep 2023

MOFO: MOtion FOcused Self-Supervision for Video Understanding

Mona Ahmadian

Frank Guerin

Andrew Gilbert

307

23 Aug 2023

Video BagNet: short temporal receptive fields increase robustness in long-term action recognition

Ombretta Strafforello

X. Liu

Klamer Schutte

Jan van Gemert

149

22 Aug 2023

View while Moving: Efficient Video Recognition in Long-untrimmed VideosACM Multimedia (ACM MM), 2023

Lanshan Zhang

Yang Liu

264

09 Aug 2023

A Survey on Deep Learning-based Spatio-temporal Action Detection

Peng Wang

Fanwei Zeng

Yu Qian

224

03 Aug 2023

Relation-Aware Distribution Representation Network for Person Clustering with Multiple ModalitiesIEEE transactions on multimedia (IEEE TMM), 2023

158

01 Aug 2023

MovieChat: From Dense Token to Sparse Memory for Long Video UnderstandingComputer Vision and Pattern Recognition (CVPR), 2023

...

624

455

31 Jul 2023

TUNeS: A Temporal U-Net with Self-Attention for Video-based Surgical Phase RecognitionIEEE Transactions on Biomedical Engineering (IEEE Trans. Biomed. Eng.), 2023

Isabel Funke

Dominik Rivoir

Stefanie Krell

Stefanie Speidel

398

19 Jul 2023

What Can Simple Arithmetic Operations Do for Temporal Modeling?IEEE International Conference on Computer Vision (ICCV), 2023

Jingdong Wang

Wanli Ouyang

212

18 Jul 2023

Human-to-Human Interaction DetectionInternational Conference on Neural Information Processing (ICONIP), 2023

347

02 Jul 2023

How can objects help action recognition?Computer Vision and Pattern Recognition (CVPR), 2023

233

20 Jun 2023

Of Mice and Mates: Automated Classification and Modelling of Mouse Behaviour in Groups using a Single Model across CagesInternational Journal of Computer Vision (IJCV), 2023

Michael P. J. Camilleri

R. Bains

Christopher K. I. Williams

157

05 Jun 2023

Metrics Matter in Surgical Phase Recognition

Isabel Funke

Dominik Rivoir

Stefanie Speidel

150

23 May 2023

Modelling Spatio-Temporal Interactions for Compositional Action Recognition

Ramanathan Rajendiran

Debaditya Roy

Basura Fernando

228

04 May 2023

End-to-End Spatio-Temporal Action Localisation with Video TransformersComputer Vision and Pattern Recognition (CVPR), 2023

251

24 Apr 2023

MRSN: Multi-Relation Support Network for Video Action DetectionIEEE International Conference on Multimedia and Expo (ICME), 2023

256

24 Apr 2023

Efficient Video Action Detection with Token Dropout and Context RefinementIEEE International Conference on Computer Vision (ICCV), 2023

Lei Chen

Zhan Tong

Yibing Song

Gangshan Wu

Limin Wang

310

17 Apr 2023

Verbs in Action: Improving verb understanding in video-language modelsIEEE International Conference on Computer Vision (ICCV), 2023

373

13 Apr 2023

Interaction-Aware Prompting for Zero-Shot Spatio-Temporal Action Detection

321

10 Apr 2023

Boundary-Denoising for Video Activity LocalizationInternational Conference on Learning Representations (ICLR), 2023

Juan-Manuel Perez-Rua

Guohao Li

190

06 Apr 2023

VicTR: Video-conditioned Text Representations for Activity RecognitionComputer Vision and Pattern Recognition (CVPR), 2023

347

05 Apr 2023

DOAD: Decoupled One Stage Action Detection Network

Fan Wang

194

01 Apr 2023

Streaming Video ModelComputer Vision and Pattern Recognition (CVPR), 2023

234

30 Mar 2023

CycleACR: Cycle Modeling of Actor-Context Relations for Video Action DetectionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Lei Chen

Zhan Tong

Yibing Song

Gangshan Wu

Limin Wang

190

28 Mar 2023

Open Set Action Recognition via Multi-Label Evidential LearningComputer Vision and Pattern Recognition (CVPR), 2023

179

27 Feb 2023

YOWOv2: A Stronger yet Efficient Multi-level Detection Framework for Real-time Spatio-temporal Action DetectionInternational Conference on Intelligent Robotics and Applications (ICIRA), 2023

Jianhua Yang

Kun Dai

ObjD

256

14 Feb 2023

Program Generation from Diverse Video DemonstrationsBritish Machine Vision Conference (BMVC), 2023

Qi Wu

01 Feb 2023

Video Semantic Segmentation with Inter-Frame Feature Fusion and Inner-Frame Feature Refinement

247

10 Jan 2023

HierVL: Learning Hierarchical Video-Language EmbeddingsComputer Vision and Pattern Recognition (CVPR), 2023

438

05 Jan 2023

Deep set conditioned latent representations for action recognitionVISIGRAPP (VISIGRAPP), 2022

168

21 Dec 2022

A Survey on Human Action Recognition

Zhou Shuchang

226

20 Dec 2022

Weakly Supervised Video Anomaly Detection Based on Cross-Batch Clustering GuidanceIEEE International Conference on Multimedia and Expo (ICME), 2022

Peng Wang

114

16 Dec 2022

EgoLoc: Revisiting 3D Object Localization from Egocentric Videos with Visual QueriesIEEE International Conference on Computer Vision (ICCV), 2022

270

14 Dec 2022

Ego Vehicle Speed Estimation using 3D Convolution with Masked Attention

Athul M. Mathew

Thariq Khalid

145

11 Dec 2022

Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly Supervised Video Anomaly DetectionComputer Vision and Pattern Recognition (CVPR), 2022

Guorong Li

Ming-Hsuan Yang

207

08 Dec 2022

Spatio-Temporal Crop Aggregation for Video Representation LearningIEEE International Conference on Computer Vision (ICCV), 2022

Sepehr Sameni

Simon Jenni

Paolo Favaro

312

30 Nov 2022

Re^2TAL: Rewiring Pretrained Video Backbones for Reversible Temporal Action LocalizationComputer Vision and Pattern Recognition (CVPR), 2022

283

25 Nov 2022