v1v2 (latest)

BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

European Conference on Computer Vision (ECCV), 2022

31 March 2022

ArXiv (abs)PDF HTML Github (18★)

Papers citing "BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers"

50 / 973 papers shown

Seeing Beyond Views: Multi-View Driving Scene Video Generation with Holistic Attention

349

04 Dec 2024

Redundant Queries in DETR-Based 3D Detection Methods: Unnecessary and Prunable

488

03 Dec 2024

OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations

579

03 Dec 2024

Epipolar Attention Field Transformers for Bird's Eye View Semantic SegmentationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

319

02 Dec 2024

HoloDrive: Holistic 2D-3D Multi-Modal Street Scene Generation for Autonomous Driving

363

02 Dec 2024

SpaRC: Sparse Radar-Camera Fusion for 3D Object Detection

388

29 Nov 2024

Improving Batch Normalization with TTA for Robust Object Detection in Self-Driving

294

28 Nov 2024

Visual SLAMMOT Considering Multiple Motion Models

Peilin Tian

Hao Li

340

28 Nov 2024

FASIONAD : FAst and Slow FusION Thinking Systems for Human-Like Autonomous Driving with Adaptive Feedback

...

243

27 Nov 2024

^2

-World: An Efficient World Model through Decoupled Dynamic Flow

252

26 Nov 2024

OpenAD: Open-World Autonomous Driving Benchmark for 3D Object Detection

425

26 Nov 2024

Monocular Lane Detection Based on Deep Learning: A Survey

707

25 Nov 2024

Three Cars Approaching within 100m! Enhancing Distant Geometry by Tri-Axis Voxel Scanning for Camera-based Semantic Scene CompletionComputer Vision and Pattern Recognition (CVPR), 2024

Jongseong Bae

Junwoo Ha

Ha Young Kim

398

25 Nov 2024

Language Driven Occupancy Prediction

488

25 Nov 2024

Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data

374

23 Nov 2024

DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous DrivingComputer Vision and Pattern Recognition (CVPR), 2024

...

668

153

22 Nov 2024

Spatiotemporal Decoupling for Efficient Vision-Based Occupancy ForecastingComputer Vision and Pattern Recognition (CVPR), 2024

199

21 Nov 2024

A Resource Efficient Fusion Network for Object Detection in Bird's-Eye View using Camera and Raw Radar Data

292

20 Nov 2024

GaussianPretrain: A Simple Unified 3D Gaussian Representation for Visual Pre-training in Autonomous Driving

291

19 Nov 2024

Unveiling the Hidden: Online Vectorized HD Map Construction with Clip-Level Token Interaction and PropagationNeural Information Processing Systems (NeurIPS), 2024

184

17 Nov 2024

V2X-Radar: A Multi-modal Dataset with 4D Radar for Cooperative Perception

...

495

17 Nov 2024

EVT: Efficient View Transformation for Multi-Modal 3D Object Detection

538

16 Nov 2024

EMPERROR: A Flexible Generative Perception Error Model for Probing Self-Driving PlannersIEEE Robotics and Automation Letters (RA-L), 2024

479

12 Nov 2024

Fast and Efficient Transformer-based Method for Bird's Eye View Instance Prediction

Miguel Antunes-García

L. Bergasa

Santiago Montiel-Marín

R. Barea

Fabio Sánchez-García

Ángel Llamazares

249

11 Nov 2024

LSSInst: Improving Geometric Modeling in LSS-Based BEV Perception with Instance RepresentationInternational Conference on 3D Vision (3DV), 2024

313

09 Nov 2024

ZOPP: A Framework of Zero-shot Offboard Panoptic Perception for Autonomous DrivingNeural Information Processing Systems (NeurIPS), 2024

215

08 Nov 2024

CFPNet: Improving Lightweight ToF Depth Completion via Cross-zone Feature PropagationInternational Conference on 3D Vision (3DV), 2024

579

07 Nov 2024

OccLoff: Learning Optimized Feature Fusion for 3D Occupancy PredictionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

342

06 Nov 2024

CRT-Fusion: Camera, Radar, Temporal Fusion Using Motion Information for 3D Object DetectionNeural Information Processing Systems (NeurIPS), 2024

Jisong Kim

Minjae Seong

Jun Won Choi

465

05 Nov 2024

Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-ResolutionComputer Vision and Pattern Recognition (CVPR), 2024

Huan Zheng

Wencheng Han

Jianbing Shen

459

05 Nov 2024

VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector QuantizationNeural Information Processing Systems (NeurIPS), 2024

166

03 Nov 2024

HeightMapNet: Explicit Height Modeling for End-to-End HD Map LearningIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

177

03 Nov 2024

GAFusion: Adaptive Fusing LiDAR and Camera with Multiple Guidance for 3D Object DetectionComputer Vision and Pattern Recognition (CVPR), 2024

331

01 Nov 2024

Uncertainty Estimation for 3D Object Detection via Evidential Learning

338

31 Oct 2024

EMMA: End-to-End Multimodal Model for Autonomous Driving

...

433

117

30 Oct 2024

Unified Domain Generalization and Adaptation for Multi-View 3D Object DetectionNeural Information Processing Systems (NeurIPS), 2024

396

29 Oct 2024

Senna: Bridging Large Vision-Language Models and End-to-End Autonomous Driving

Chang Huang

311

29 Oct 2024

BEVPose: Unveiling Scene Semantics through Pose-Guided Multi-Modal BEV AlignmentIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024

M. Hosseinzadeh

Ian Reid

235

28 Oct 2024

UniDrive: Towards Universal Driving Perception Across Camera Configurations

427

17 Oct 2024

Real-time Stereo-based 3D Object Detection for Streaming PerceptionNeural Information Processing Systems (NeurIPS), 2024

214

16 Oct 2024

MambaBEV: An efficient 3D detection model with Mamba2

263

16 Oct 2024

TEOcc: Radar-camera Multi-modal Occupancy Prediction via Temporal EnhancementEuropean Conference on Artificial Intelligence (ECAI), 2024

284

15 Oct 2024

big.LITTLE Vision Transformer for Efficient Visual Recognition

Yulong Wang

Jifeng Dai

262

14 Oct 2024

ROA-BEV: 2D Region-Oriented Attention for BEV-based 3D Object Detection

254

14 Oct 2024

ET-Former: Efficient Triplane Deformable Attention for 3D Semantic Scene Completion From Monocular Camera

361

14 Oct 2024

SPA: 3D Spatial-Awareness Enables Effective Embodied RepresentationInternational Conference on Learning Representations (ICLR), 2024

Haoyi Zhu

Honghui Yang

Yating Wang

Jiange Yang

Limin Wang

Tong He

3DH

384

10 Oct 2024

Progressive Multi-Modal Fusion for Robust 3D Object DetectionConference on Robot Learning (CoRL), 2024

328

09 Oct 2024

QuadBEV: An Efficient Quadruple-Task Perception Framework via Bird's-Eye-View Representation

Yuxin Li

160

09 Oct 2024

Learning Content-Aware Multi-Modal Joint Input Pruning via Bird's-Eye-View Representation

Yuxin Li

191

09 Oct 2024

BEVLoc: Cross-View Localization and Matching via Birds-Eye-View SynthesisIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024

Christopher Klammer

Michael Kaess

221

08 Oct 2024