Motion-aware Contrastive Video Representation Learning via Foreground-background Merging

30 September 2021

Papers citing "Motion-aware Contrastive Video Representation Learning via Foreground-background Merging"

40 / 40 papers shown

Title
SMILE: Infusing Spatial and Motion Semantics in Masked Video Learning Fida Mohammad Thoker Letian Jiang Chen Zhao Bernard Ghanem 57 0 0 01 Apr 2025
Coca-Splat: Collaborative Optimization for Camera Parameters and 3D Gaussians Jiamin Wu Hongyang Li Xiaoke Jiang Yuan Yao Lei Zhang 3DGS 51 0 0 01 Apr 2025
Cross-Modal Consistency Learning for Sign Language Recognition Kepeng Wu Zecheng Li Weichao Zhao Hezhen Hu Wengang Zhou SLR 47 0 0 16 Mar 2025
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition Otto Brookes Maksim Kukushkin Majid Mirmehdi Colleen Stephens Paula Dieguez ... Lukas Boesch Thomas Schmid M. Arandjelovic H. Kühl T. Burghardt 46 0 0 28 Feb 2025
Learning to Generalize without Bias for Open-Vocabulary Action Recognition Yating Yu Congqi Cao Yifan Zhang Yanning Zhang VLM 43 0 0 27 Feb 2025
EndoMamba: An Efficient Foundation Model for Endoscopic Videos via Hierarchical Pre-training Qingyao Tian Huai Liao Xinyan Huang Bingyu Yang Dongdong Lei Sebastien Ourselin Hongbin Liu Mamba 68 0 0 26 Feb 2025
OccludeNet: A Causal Journey into Mixed-View Actor-Centric Video Action Recognition under Occlusions Guanyu Zhou Wenxuan Liu Wenxin Huang Xuemei Jia X. Zhong Chia-Wen Lin CML 76 0 0 24 Nov 2024
LocoMotion: Learning Motion-Focused Video-Language Representations Hazel Doughty Fida Mohammad Thoker Cees G. M. Snoek 41 2 0 15 Oct 2024
Image Compression for Machine and Human Vision with Spatial-Frequency Adaptation Han Li Shaohui Li Shuangrui Ding Wenrui Dai Maida Cao Chenglin Li Junni Zou Hongkai Xiong VLM 35 5 0 13 Jul 2024
Rethinking Image-to-Video Adaptation: An Object-centric Perspective Rui Qian Shuangrui Ding Dahua Lin OCL 52 1 0 09 Jul 2024
Dual DETRs for Multi-Label Temporal Action Detection Yuhan Zhu Guozhen Zhang Jing Tan Gangshan Wu Limin Wang 35 11 0 31 Mar 2024
Separating common from salient patterns with Contrastive Representation Learning Robin Louiset Edouard Duchesnay Antoine Grigis Pietro Gori SSL DRL 38 1 0 19 Feb 2024
Collaboratively Self-supervised Video Representation Learning for Action Recognition Jie M. Zhang Zhifan Wan Lanqing Hu Stephen Lin Shuzhe Wu Shiguang Shan TTA 67 1 0 15 Jan 2024
DEVIAS: Learning Disentangled Video Representations of Action and Scene for Holistic Video Understanding Kyungho Bae Geo Ahn Youngrae Kim Jinwoo Choi 23 2 0 30 Nov 2023
Betrayed by Attention: A Simple yet Effective Approach for Self-supervised Video Object Segmentation Shuangrui Ding Rui Qian Haohang Xu Dahua Lin Hongkai Xiong VOS 35 4 0 29 Nov 2023
Frequency-Aware Transformer for Learned Image Compression Han Li Shaohui Li Wenrui Dai Chenglin Li Junni Zou H. Xiong ViT 33 27 0 25 Oct 2023
DynaPix SLAM: A Pixel-Based Dynamic SLAM Approach Chenghao Xu Elia Bonetto Aamir Ahmad 16 1 0 18 Sep 2023
Fine-Grained Spatiotemporal Motion Alignment for Contrastive Video Representation Learning Minghao Zhu Xiao Lin Ronghao Dang Chengju Liu Qi Chen VGen 22 8 0 01 Sep 2023
LAC: Latent Action Composition for Skeleton-based Action Segmentation Di Yang Yaohui Wang A. Dantcheva Quan Kong Lorenzo Garattoni Gianpiero Francesca F. Brémond 29 9 0 28 Aug 2023
Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos Rui Qian Shuangrui Ding Xian Liu Dahua Lin 21 14 0 19 Aug 2023
Prune Spatio-temporal Tokens by Semantic-aware Temporal Accumulation Shuangrui Ding Peisen Zhao Xiaopeng Zhang Rui Qian H. Xiong Qi Tian ViT 22 16 0 08 Aug 2023
AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models without Specific Tuning Yuwei Guo Ceyuan Yang Anyi Rao Zhengyang Liang Yaohui Wang Yu Qiao Maneesh Agrawala Dahua Lin Bo Dai VGen 18 781 0 10 Jul 2023
Foundation Model for Endoscopy Video Analysis via Large-scale Self-supervised Pre-train Zhao Wang Chang Liu Shaoting Zhang Qi Dou MedIm 23 58 0 29 Jun 2023
Self-Supervised Video Representation Learning via Latent Time Navigation Di Yang Yaohui Wang Quan Kong A. Dantcheva Lorenzo Garattoni Gianpiero Francesca F. Brémond SSL AI4TS 41 10 0 10 May 2023
Looking Similar, Sounding Different: Leveraging Counterfactual Cross-Modal Pairs for Audiovisual Representation Learning Nikhil Singh Chih-Wei Wu Iroro Orife Mahdi M. Kalayeh 23 2 0 12 Apr 2023
Tubelet-Contrastive Self-Supervision for Video-Efficient Generalization Fida Mohammad Thoker Hazel Doughty Cees G. M. Snoek ViT 35 9 0 20 Mar 2023
iQuery: Instruments as Queries for Audio-Visual Sound Separation Jiaben Chen Renrui Zhang Dongze Lian Jiaqi Yang Ziyao Zeng Jianbo Shi 16 26 0 07 Dec 2022
Mitigating and Evaluating Static Bias of Action Representations in the Background and the Foreground Haoxin Li Yuan Liu Hanwang Zhang Boyang Li 30 15 0 23 Nov 2022
Face-to-Face Contrastive Learning for Social Intelligence Question-Answering Alex Wilf Qianli Ma Paul Pu Liang Amir Zadeh Louis-Philippe Morency 31 10 0 29 Jul 2022
Static and Dynamic Concepts for Self-supervised Video Representation Learning Rui Qian Shuangrui Ding Xian Liu Dahua Lin SSL 23 22 0 26 Jul 2022
Dual Contrastive Learning for Spatio-temporal Representation Shuangrui Ding Rui Qian H. Xiong AI4TS SSL 28 21 0 12 Jul 2022
Frequency Selective Augmentation for Video Representation Learning Jinhyung Kim Taeoh Kim Minho Shim Dongyoon Han Dongyoon Wee Junmo Kim AI4TS 41 3 0 08 Apr 2022
PreViTS: Contrastive Pretraining with Video Tracking Supervision Brian Chen Ramprasaath R. Selvaraju Shih-Fu Chang Juan Carlos Niebles Nikhil Naik ViT 25 2 0 01 Dec 2021
Instance Localization for Self-supervised Detection Pretraining Ceyuan Yang Zhirong Wu Bolei Zhou Stephen Lin ViT SSL 100 145 0 16 Feb 2021
Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation Golnaz Ghiasi Yin Cui A. Srinivas Rui Qian Tsung-Yi Lin E. D. Cubuk Quoc V. Le Barret Zoph ISeg 228 968 0 13 Dec 2020
Self-supervised Co-training for Video Representation Learning Tengda Han Weidi Xie Andrew Zisserman SSL 209 308 0 19 Oct 2020
MixCo: Mix-up Contrastive Learning for Visual Representation Sungnyun Kim Gihun Lee Sangmin Bae Seyoung Yun SSL 106 80 0 13 Oct 2020
Video Representation Learning by Recognizing Temporal Transformations Simon Jenni Givi Meishvili Paolo Favaro 131 133 0 21 Jul 2020
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 412 595 0 21 Jul 2020
Improved Baselines with Momentum Contrastive Learning Xinlei Chen Haoqi Fan Ross B. Girshick Kaiming He SSL 267 3,369 0 09 Mar 2020