v1v2 (latest)

Masked Feature Prediction for Self-Supervised Visual Pre-Training

16 December 2021

Christoph Feichtenhofer

ViT

ArXiv (abs)PDF HTML

Papers citing "Masked Feature Prediction for Self-Supervised Visual Pre-Training"

50 / 498 papers shown

Affordance Grounding from Demonstration Video to Target ImageComputer Vision and Pattern Recognition (CVPR), 2023

181

26 Mar 2023

3Mformer: Multi-order Multi-mode Transformer for Skeletal Action RecognitionComputer Vision and Pattern Recognition (CVPR), 2023

Lei Wang

Piotr Koniusz

ViT

224

25 Mar 2023

Active Finetuning: Exploiting Annotation Budget in the Pretraining-Finetuning ParadigmComputer Vision and Pattern Recognition (CVPR), 2023

Wei Zhan

248

25 Mar 2023

Masked Scene Contrast: A Scalable Framework for Unsupervised 3D Representation LearningComputer Vision and Pattern Recognition (CVPR), 2023

Xin Wen

272

24 Mar 2023

Temperature Schedules for Self-Supervised Contrastive Methods on Long-Tail DataInternational Conference on Learning Representations (ICLR), 2023

Anna Kukleva

Moritz Bohle

Bernt Schiele

Hilde Kuehne

Christian Rupprecht

256

23 Mar 2023

The effectiveness of MAE pre-pretraining for billion-scale pretrainingIEEE International Conference on Computer Vision (ICCV), 2023

Mannat Singh

Quentin Duval

Kalyan Vasudev Alwala

Haoqi Fan

Vaibhav Aggarwal

...

Piotr Dollár

Christoph Feichtenhofer

377

23 Mar 2023

FeatureNeRF: Learning Generalizable NeRFs by Distilling Foundation ModelsIEEE International Conference on Computer Vision (ICCV), 2023

247

22 Mar 2023

Correlational Image Modeling for Self-Supervised Visual Pre-TrainingComputer Vision and Pattern Recognition (CVPR), 2023

315

22 Mar 2023

ViC-MAE: Self-Supervised Representation Learning from Images and Video with Contrastive Masked Autoencoders

167

21 Mar 2023

FedMAE: Federated Self-Supervised Learning with One-Block Masked Auto-Encoder

189

20 Mar 2023

AdPE: Adversarial Positional Embeddings for Pretraining Vision Transformers via MAE+

Guo-Jun Qi

177

14 Mar 2023

DPPMask: Masked Image Modeling with Determinantal Point ProcessesIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Pheng-Ann Heng

305

13 Mar 2023

Improving Masked Autoencoders by Learning Where to MaskChinese Conference on Pattern Recognition and Computer Vision (CPRCV), 2023

172

12 Mar 2023

Mimic before Reconstruct: Enhancing Masked Autoencoders with Feature MimickingInternational Journal of Computer Vision (IJCV), 2023

169

09 Mar 2023

Masked Image Modeling with Local Multi-Scale ReconstructionComputer Vision and Pattern Recognition (CVPR), 2023

199

09 Mar 2023

Centroid-centered Modeling for Efficient Vision Transformer Pre-trainingChinese Conference on Pattern Recognition and Computer Vision (CPRCV), 2023

Bo Du

144

08 Mar 2023

Masked Images Are Counterfactual Samples for Robust Fine-tuningComputer Vision and Pattern Recognition (CVPR), 2023

358

06 Mar 2023

PixMIM: Rethinking Pixel Reconstruction in Masked Image Modeling

249

04 Mar 2023

OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge Collaborative AutoML System

...

Yibing Zhan

Jing Zhang

Chaoyue Wang

Dacheng Tao

232

01 Mar 2023

Generic-to-Specific Distillation of Masked AutoencodersComputer Vision and Pattern Recognition (CVPR), 2023

273

28 Feb 2023

Mask3D: Pre-training 2D Vision Transformers by Learning Masked 3D PriorsComputer Vision and Pattern Recognition (CVPR), 2023

Matthias Nießner

230

28 Feb 2023

Remote Sensing Scene Classification with Masked Image Modeling (MIM)Remote Sensing (RS), 2023

Liya Wang

A. Tien

225

28 Feb 2023

Layer Grafted Pre-training: Bridging Contrastive Learning And Masked Image Modeling For Label-Efficient RepresentationsInternational Conference on Learning Representations (ICLR), 2023

Lu Yuan

Zicheng Liu

Zinan Lin

SSL VLM CLIP

246

27 Feb 2023

EnfoMax: Domain Entropy and Mutual Information Maximization for Domain Generalized Face Anti-spoofingNeurocomputing (Neurocomputing), 2023

Tianyi Zheng

CVBM

221

17 Feb 2023

Semantic Image Segmentation: Two Decades of ResearchFoundations and Trends in Computer Graphics and Vision (FTCGV), 2023

272

13 Feb 2023

Anatomical Invariance Modeling and Semantic Alignment for Self-supervised Learning in 3D Medical Image AnalysisIEEE International Conference on Computer Vision (ICCV), 2023

289

11 Feb 2023

AIM: Adapting Image Models for Efficient Video Action RecognitionInternational Conference on Learning Representations (ICLR), 2023

418

219

06 Feb 2023

Contrast with Reconstruct: Contrastive 3D Representation Learning Guided by Generative PretrainingInternational Conference on Machine Learning (ICML), 2023

Xiangyu Zhang

402

188

05 Feb 2023

MOMA:Distill from Self-Supervised Teachers

Xingtai Lv

Nandakishor Desai

M. Palaniswami

254

04 Feb 2023

Energy-Inspired Self-Supervised Pretraining for Vision ModelsInternational Conference on Learning Representations (ICLR), 2023

Ze Wang

Jiang Wang

Zicheng Liu

Qiang Qiu

247

02 Feb 2023

Aerial Image Object Detection With Vision Transformer Detector (ViTDet)IEEE International Geoscience and Remote Sensing Symposium (IGARSS), 2023

Liya Wang

A. Tien

414

28 Jan 2023

Compact Transformer Tracker with Correlative Masked ModelingAAAI Conference on Artificial Intelligence (AAAI), 2023

Run Luo

153

26 Jan 2023

Self-Supervised Learning from Images with a Joint-Embedding Predictive ArchitectureComputer Vision and Pattern Recognition (CVPR), 2023

Pascal Vincent

466

579

19 Jan 2023

Vision Learners Meet Web Image-Text Pairs

183

17 Jan 2023

RILS: Masked Visual Reconstruction in Language Semantic SpaceComputer Vision and Pattern Recognition (CVPR), 2023

Shusheng Yang

Ying Shan

193

17 Jan 2023

A Survey on Self-supervised Learning: Algorithms, Applications, and Future TrendsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

569

354

13 Jan 2023

Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding TasksConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

302

12 Jan 2023

Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked ModelingInternational Conference on Learning Representations (ICLR), 2023

278

135

09 Jan 2023

Ego-Only: Egocentric Action Detection without Exocentric TransferringIEEE International Conference on Computer Vision (ICCV), 2023

353

03 Jan 2023

TinyMIM: An Empirical Study of Distilling MIM Pre-trained ModelsComputer Vision and Pattern Recognition (CVPR), 2023

321

03 Jan 2023

Disjoint Masking with Joint Distillation for Efficient Masked Image ModelingIEEE transactions on multimedia (IEEE TMM), 2022

Chunyu Xie

344

31 Dec 2022

Transformers in Action Recognition: A Review on Temporal Modeling

Elham Shabaninia

Hossein Nezamabadi-pour

Fatemeh Shafizadegan

ViT

211

29 Dec 2022

Swin MAE: Masked Autoencoders for Small Datasets

264

28 Dec 2022

Autoencoders as Cross-Modal Teachers: Can Pretrained 2D Image Transformers Help 3D Representation Learning?International Conference on Learning Representations (ICLR), 2022

307

137

16 Dec 2022

Toward Improved Generalization: Meta Transfer of Self-supervised Knowledge on Graphs

168

16 Dec 2022

MAViL: Masked Audio-Video LearnersNeural Information Processing Systems (NeurIPS), 2022

Po-Yao (Bernie) Huang

Christoph Feichtenhofer

322

15 Dec 2022

Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and LanguageInternational Conference on Machine Learning (ICML), 2022

352

123

14 Dec 2022

FastMIM: Expediting Masked Image Modeling Pre-training for Vision

198

13 Dec 2022

Jointly Learning Visual and Auditory Speech Representations from Raw DataInternational Conference on Learning Representations (ICLR), 2022

306

12 Dec 2022

CLIP Itself is a Strong Fine-tuner: Achieving 85.7% and 88.0% Top-1 Accuracy with ViT-B and ViT-L on ImageNet

Jianmin Bao

Lu Yuan

166

12 Dec 2022