v1v2 (latest)

BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

European Conference on Computer Vision (ECCV), 2022

31 March 2022

ArXiv (abs)PDF HTML Github (18★)

Papers citing "BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers"

50 / 973 papers shown

Driving Through Uncertainty: Risk-Averse Control with LLM Commonsense for Autonomous Driving under Perception Deficits

288

10 Mar 2025

CATPlan: Loss-based Collision Prediction in End-to-End Autonomous Driving

538

10 Mar 2025

Learning A Zero-shot Occupancy Network from Vision Foundation Models via Self-supervised Adaptation

318

10 Mar 2025

HierDAMap: Towards Universal Domain Adaptive BEV Mapping via Hierarchical Perspective Priors

356

10 Mar 2025

TransParking: A Dual-Decoder Transformer Framework with Soft Localization for End-to-End Automatic Parking

Hangyu Du

Chee-Meng Chew

ViT

220

08 Mar 2025

DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous DrivingInternational Conference on Learning Representations (ICLR), 2025

405

07 Mar 2025

Manboformer: Learning Gaussian Representations via Spatial-temporal Attention Mechanism

Ziyue Zhao

Qining Qi

Jianfa Ma

217

06 Mar 2025

H3O: Hyper-Efficient 3D Occupancy Prediction with Heterogeneous SupervisionIEEE International Conference on Robotics and Automation (ICRA), 2025

391

06 Mar 2025

DualDiff+: Dual-Branch Diffusion for High-Fidelity Video Generation with Reward Guidance

355

05 Mar 2025

IC-Mapper: Instance-Centric Spatio-Temporal Modeling for Online Vectorized Map ConstructionACM Multimedia (MM), 2024

407

05 Mar 2025

Dur360BEV: A Real-world 360-degree Single Camera Dataset and Benchmark for Bird-Eye View Mapping in Autonomous DrivingIEEE International Conference on Robotics and Automation (ICRA), 2025

Amir Atapour-Abarghouei

T. Breckon

368

02 Mar 2025

BEVDiffuser: Plug-and-Play Diffusion Model for BEV Denoising with Ground-Truth GuidanceComputer Vision and Pattern Recognition (CVPR), 2025

432

27 Feb 2025

CoopDETR: A Unified Cooperative Perception Framework for 3D Detection via Object QueryIEEE International Conference on Robotics and Automation (ICRA), 2025

379

26 Feb 2025

Glad: A Streaming Scene Generator for Autonomous DrivingInternational Conference on Learning Representations (ICLR), 2025

294

26 Feb 2025

VLM-E2E: Enhancing End-to-End Autonomous Driving with Multimodal Driver Attention Fusion

438

25 Feb 2025

DeepInteraction++: Multi-Modality Interaction for Autonomous DrivingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

472

24 Feb 2025

LCV2I: Communication-Efficient and High-Performance Collaborative Perception Framework with Low-Resolution LiDAR

Xinxin Feng

Haoran Sun

Haifeng Zheng

260

24 Feb 2025

LXLv2: Enhanced LiDAR Excluded Lean 3D Object Detection with Fusion of 4D Radar and CameraIEEE Robotics and Automation Letters (IEEE RA-L), 2025

385

21 Feb 2025

Deflickering Vision-Based Occupancy Networks through Lightweight Spatio-Temporal Correlation

399

21 Feb 2025

RAD: Training an End-to-End Driving Policy via Large-Scale 3DGS-based Reinforcement Learning

...

402

18 Feb 2025

MaskGWM: A Generalizable Driving World Model with Video Mask ReconstructionComputer Vision and Pattern Recognition (CVPR), 2025

304

17 Feb 2025

FeaKM: Robust Collaborative Perception under Noisy Pose Conditions

358

16 Feb 2025

PDM-SSD: Single-Stage Three-Dimensional Object Detector With Point Dilation

230

10 Feb 2025

SMART: Advancing Scalable Map Priors for Driving Topology ReasoningIEEE International Conference on Robotics and Automation (ICRA), 2025

Henrik I. Christensen

Yue Wang

Liu Ren

LRM

363

06 Feb 2025

SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice RepresentationIEEE International Conference on Robotics and Automation (ICRA), 2025

382

28 Jan 2025

MetaOcc: Spatio-Temporal Fusion of Surround-View 4D Radar and Camera for 3D Occupancy Prediction with Dual Training Strategies

...

954

26 Jan 2025

mmCooper: A Multi-agent Multi-stage Communication-efficient and Collaboration-robust Cooperative Perception Framework

445

21 Jan 2025

A Survey of World Models for Autonomous Driving

692

20 Jan 2025

Driving in the Occupancy World: Vision-Centric 4D Occupancy Forecasting and Planning via World Models for Autonomous DrivingAAAI Conference on Artificial Intelligence (AAAI), 2024

538

20 Jan 2025

Distilling Multi-modal Large Language Models for Autonomous DrivingComputer Vision and Pattern Recognition (CVPR), 2025

Apratim Bhattacharyya

203

17 Jan 2025

DriveLM: Driving with Graph Visual Question AnsweringEuropean Conference on Computer Vision (ECCV), 2023

Chonghao Sima

Katrin Renz

Kashyap Chitta

Lawrence Yunliang Chen

802

355

17 Jan 2025

Skip Mamba Diffusion for Monocular 3D Semantic Scene CompletionAAAI Conference on Artificial Intelligence (AAAI), 2025

255

13 Jan 2025

MapGS: Generalizable Pretraining and Data Augmentation for Online Mapping via Novel View Synthesis

Henrik I. Christensen

Liu Ren

3DGS ViT

216

11 Jan 2025

CoreNet: Conflict Resolution Network for Point-Pixel Misalignment and Sub-Task Suppression of 3D LiDAR-Camera Object DetectionInformation Fusion (Inf. Fusion), 2025

269

11 Jan 2025

A Novel Vision Transformer for Camera-LiDAR Fusion based Traffic Object SegmentationInternational Conference on Agents and Artificial Intelligence (ICAART), 2025

188

06 Jan 2025

LDMapNet-U: An End-to-End System for City-Scale Lane-Level Map UpdatingKnowledge Discovery and Data Mining (KDD), 2025

288

06 Jan 2025

Master Stability Functions in Complex Networks

Suman Acharyya

Priodyuti Pradhan

Chandrakala Meena

264

26 Dec 2024

ImagineMap: Enhanced HD Map Construction with SD Maps

Yishen Ji

Zhiqi Li

Tong Lu

309

22 Dec 2024

Anchor3DLane++: 3D Lane Detection via Sample-Adaptive Sparse 3D Anchor RegressionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

392

22 Dec 2024

A Black-Box Evaluation Framework for Semantic Robustness in Bird's Eye View DetectionAAAI Conference on Artificial Intelligence (AAAI), 2024

436

18 Dec 2024

RaCFormer: Towards High-Quality 3D Object Detection via Query-based Radar-Camera FusionComputer Vision and Pattern Recognition (CVPR), 2024

986

17 Dec 2024

GaussTR: Foundation Model-Aligned Gaussian Transformer for Self-Supervised 3D Spatial UnderstandingComputer Vision and Pattern Recognition (CVPR), 2024

485

17 Dec 2024

OmniHD-Scenes: A Next-Generation Multimodal Dataset for Autonomous Driving

...

695

14 Dec 2024

DSRC: Learning Density-insensitive and Semantic-aware Collaborative Representation against CorruptionsAAAI Conference on Artificial Intelligence (AAAI), 2024

438

14 Dec 2024

GaussianWorld: Gaussian World Model for Streaming 3D Occupancy PredictionComputer Vision and Pattern Recognition (CVPR), 2024

243

13 Dec 2024

PVP: Polar Representation Boost for 3D Semantic Occupancy PredictionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

420

10 Dec 2024

HSDA: High-frequency Shuffle Data Augmentation for Bird's-Eye-View Map SegmentationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

Calvin Glisson

Qiuxiao Chen

312

09 Dec 2024

Omni-Scene: Omni-Gaussian Representation for Ego-Centric Sparse-View Scene ReconstructionComputer Vision and Pattern Recognition (CVPR), 2024

Dongxu Wei

Zhiqi Li

Peidong Liu

516

09 Dec 2024

Towards Flexible 3D Perception: Object-Centric Occupancy Completion Augments 3D Object DetectionNeural Information Processing Systems (NeurIPS), 2024

224

06 Dec 2024

Reflective Teacher: Semi-Supervised Multimodal 3D Object Detection in Bird's-Eye-View via Uncertainty MeasureIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

303

05 Dec 2024