An End-to-End Transformer Model for 3D Object Detection

16 September 2021

Papers citing "An End-to-End Transformer Model for 3D Object Detection"

50 / 294 papers shown

M3DBench: Let's Instruct Large Models with Multi-modal 3D Prompts

307

17 Dec 2023

SPEAL: Skeletal Prior Embedded Attention Learning for Cross-Source Point Cloud RegistrationAAAI Conference on Artificial Intelligence (AAAI), 2023

Chenglu Wen

220

14 Dec 2023

Cross-BERT for Point Cloud Pretraining

Peng Li

Mingqiang Wei

189

08 Dec 2023

Uni3DL: Unified Model for 3D and Language Understanding

344

05 Dec 2023

LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding, Reasoning, and PlanningComputer Vision and Pattern Recognition (CVPR), 2023

316

175

30 Nov 2023

Point Cloud Pre-training with Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Xiaoshui Huang

Wanli Ouyang

245

25 Nov 2023

Multiple View Geometry Transformers for 3D Human Pose Estimation

Steven L. Waslander

206

18 Nov 2023

Point Cloud Self-supervised Learning via 3D to Multi-view Masked Learner

322

17 Nov 2023

3DifFusionDet: Diffusion Model for 3D Object Detection with Robust LiDAR-Camera Fusion

Xinhao Xiang

Simon Dräger

Jiawei Zhang

189

07 Nov 2023

FusionViT: Hierarchical 3D Object Detection via LiDAR-Camera Vision Transformer Fusion

Xinhao Xiang

Jiawei Zhang

3DPC ViT

256

07 Nov 2023

Recent Advances in Multi-modal 3D Scene Understanding: A Comprehensive Survey and Evaluation

Peng Wang

264

24 Oct 2023

SoybeanNet: Transformer-Based Convolutional Neural Network for Soybean Pod Counting from Unmanned Aerial Vehicle (UAV) ImagesComputers and Electronics in Agriculture (Comput. Electron. Agric.), 2023

177

16 Oct 2023

Multimodal Object Query Initialization for 3D Object DetectionIEEE International Conference on Robotics and Automation (ICRA), 2023

Mathijs R. van Geerenstein

Felicia Ruppel

Klaus C. J. Dietmayer

D. Gavrila

3DPC

259

16 Oct 2023

PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm

Di Huang

...

Chunhua Shen

Yu Qiao

Tong He

Wanli Ouyang

SSL

622

12 Oct 2023

3DS-SLAM: A 3D Object Detection based Semantic SLAM towards Dynamic Indoor Environments

210

10 Oct 2023

Uni3DETR: Unified 3D Detection TransformerNeural Information Processing Systems (NeurIPS), 2023

327

09 Oct 2023

Anyview: Generalizable Indoor 3D Object Detection with Variable Frames

300

09 Oct 2023

CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object DetectionNeural Information Processing Systems (NeurIPS), 2023

Yang Cao

Yihan Zeng

Hang Xu

Dan Xu

3DPC ObjD

243

04 Oct 2023

CAIT: Triple-Win Compression towards High Accuracy, Fast Inference, and Favorable Transferability For ViTsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

280

27 Sep 2023

Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous DrivingIEEE International Conference on Computer Vision (ICCV), 2023

242

25 Sep 2023

Regress Before Construct: Regress Autoencoder for Point Cloud Self-supervised LearningACM Multimedia (ACM MM), 2023

186

25 Sep 2023

Holistic Geometric Feature Learning for Structured ReconstructionIEEE International Conference on Computer Vision (ICCV), 2023

200

18 Sep 2023

Object2Scene: Putting Objects in Context for Open-Vocabulary 3D Detection

241

18 Sep 2023

Vote2Cap-DETR++: Decoupling Localization and Describing for End-to-End 3D Dense CaptioningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Tao Chen

300

06 Sep 2023

Dense Object Grounding in 3D ScenesACM Multimedia (ACM MM), 2023

Wencan Huang

Daizong Liu

Wei Hu

259

05 Sep 2023

RADIO: Reference-Agnostic Dubbing Video SynthesisIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

273

05 Sep 2023

Mask-Attention-Free Transformer for 3D Instance SegmentationIEEE International Conference on Computer Vision (ICCV), 2023

281

04 Sep 2023

OpenIns3D: Snap and Lookup for 3D Open-vocabulary Instance SegmentationEuropean Conference on Computer Vision (ECCV), 2023

483

01 Sep 2023

Point-Bind & Point-LLM: Aligning Point Cloud with Multi-modality for 3D Understanding, Generation, and Instruction Following

Ziyu Guo

...

Pheng-Ann Heng

376

189

01 Sep 2023

Group Regression for Query Based Object Detection and Tracking

Felicia Ruppel

F. Faion

Claudius Gläser

Klaus C. J. Dietmayer

109

28 Aug 2023

ImGeoNet: Image-induced Geometry-aware Voxel Representation for Multi-view 3D Object DetectionIEEE International Conference on Computer Vision (ICCV), 2023

Cheng Sun

306

17 Aug 2023

Chat-3D: Data-efficiently Tuning Large Language Model for Universal Dialogue of 3D Scenes

Zehan Wang

Haifeng Huang

Yang Zhao

Ziang Zhang

Zhou Zhao

288

109

17 Aug 2023

V-DETR: DETR with Vertex Relative Position Encoding for 3D Object DetectionInternational Conference on Learning Representations (ICLR), 2023

186

08 Aug 2023

Lowis3D: Language-Driven Open-World Instance-Level 3D Scene UnderstandingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiaojuan Qi

182

01 Aug 2023

Take-A-Photo: 3D-to-2D Generative Pre-training of Point Cloud ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Jie Zhou

248

27 Jul 2023

3DRP-Net: 3D Relative Position-aware Network for 3D Visual GroundingConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Xize Cheng

Zhou Zhao

176

25 Jul 2023

GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo LabelersIEEE International Conference on Computer Vision (ICCV), 2023

236

25 Jul 2023

A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and FutureIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Chaoyang Zhu

Long Chen

ObjD VLM

511

18 Jul 2023

Towards Open Vocabulary Learning: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiangtai Li

...

Jiangning Zhang

406

218

28 Jun 2023

UniG3D: A Unified 3D Object Generation Dataset

Xiaoshui Huang

Wanli Ouyang

208

19 Jun 2023

Randomized 3D Scene Generation for Generalizable Self-Supervised Pre-Training

Lanxiao Li

M. Heizmann

160

07 Jun 2023

Multi-View Representation is What You Need for Point-Cloud Pre-TrainingInternational Conference on Learning Representations (ICLR), 2023

498

05 Jun 2023

Multi-CLIP: Contrastive Vision-Language Pre-training for Question Answering tasks in 3D ScenesBritish Machine Vision Conference (BMVC), 2023

200

04 Jun 2023

Hiera: A Hierarchical Vision Transformer without the Bells-and-WhistlesInternational Conference on Machine Learning (ICML), 2023

...

Christoph Feichtenhofer

3DH

305

304

01 Jun 2023

Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color ContrastACM Multimedia (ACM MM), 2023

458

31 May 2023

VoxDet: Voxel Learning for Novel Instance DetectionNeural Information Processing Systems (NeurIPS), 2023

426

26 May 2023

Hierarchical Adaptive Voxel-guided Sampling for Real-time Applications in Large-scale Point Clouds

193

23 May 2023

Cross3DVG: Cross-Dataset 3D Visual Grounding on Different RGB-D ScansInternational Conference on 3D Vision (3DV), 2023

301

23 May 2023

Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation ModelsNeural Information Processing Systems (NeurIPS), 2023

Zhimin Chen

Longlong Jing

Yingwei Li

Bing Li

367

15 May 2023

ULIP-2: Towards Scalable Multimodal Pre-training for 3D UnderstandingComputer Vision and Pattern Recognition (CVPR), 2023

...

Jiajun Wu

Caiming Xiong

Ran Xu

Juan Carlos Niebles

Silvio Savarese

380

192

14 May 2023