GeoMIM: Towards Better 3D Knowledge Transfer via Masked Image Modeling
for Multi-view 3D Understanding

GeoMIM: Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-view 3D Understanding

20 March 2023

Papers citing "GeoMIM: Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-view 3D Understanding"

10 / 10 papers shown

Title
Masked Image Modeling: A Survey Vlad Hondru Florinel-Alin Croitoru Shervin Minaee Radu Tudor Ionescu N. Sebe 45 6 0 13 Aug 2024
OccFeat: Self-supervised Occupancy Feature Prediction for Pretraining BEV Segmentation Networks Sophia Sirko-Galouchenko Alexandre Boulch Spyros Gidaris Andrei Bursuc Antonín Vobecký Patrick Pérez Renaud Marlet 3DPC 22 7 0 22 Apr 2024
Collaborative Semantic Occupancy Prediction with Hybrid Feature Fusion in Connected Automated Vehicles Rui Song Chenwei Liang Hu Cao Zhiran Yan Walter Zimmer Markus Gross Andreas Festag Alois C. Knoll 8 21 0 12 Feb 2024
Time Will Tell: New Outlooks and A Baseline for Temporal Multi-View 3D Object Detection Jinhyung D. Park Chenfeng Xu Shijia Yang Kurt Keutzer Kris M. Kitani M. Tomizuka Wei Zhan 73 153 0 05 Oct 2022
BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo Yinhao Li Han Bao Zheng Ge Jinrong Yang Jian‐Yuan Sun Zeming Li 66 110 0 21 Sep 2022
Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud Pre-training Renrui Zhang Ziyu Guo Rongyao Fang Bingyan Zhao Dong Wang Yu Qiao Hongsheng Li Peng Gao 3DPC 156 241 0 28 May 2022
MonoDETR: Depth-guided Transformer for Monocular 3D Object Detection Renrui Zhang Han Qiu Tai Wang Ziyu Guo Xuan Xu Xuanzhuo Xu Ziteng Cui Peng Gao Hongsheng Li Hongsheng Li ViT MDE 29 78 0 24 Mar 2022
MonoDistill: Learning Spatial Features for Monocular 3D Object Detection Zhiyu Chong Xinzhu Ma Hong Zhang Yuxin Yue Haojie Li Zhihui Wang Wanli Ouyang 3DPC 69 96 0 26 Jan 2022
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 255 7,337 0 11 Nov 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,735 0 24 Feb 2021