v1v2 (latest)

BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

European Conference on Computer Vision (ECCV), 2022

31 March 2022

ArXiv (abs)PDF HTML Github (18★)

Papers citing "BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers"

50 / 974 papers shown

MAESTRO: Task-Relevant Optimization via Adaptive Feature Enhancement and Suppression for Multi-task 3D Perception

127

22 Sep 2025

RCTDistill: Cross-Modal Knowledge Distillation Framework for Radar-Camera 3D Object Detection with Temporal Fusion

176

22 Sep 2025

TinyBEV: Cross Modal Knowledge Distillation for Efficient Multi Task Bird's Eye View Perception and Planning

Reeshad Khan

John Gauch

185

22 Sep 2025

ST-GS: Vision-Based 3D Semantic Occupancy Prediction with Spatial-Temporal Gaussian Splatting

106

20 Sep 2025

SQS: Enhancing Sparse Perception Models via Query-based Splatting in Autonomous Driving

160

20 Sep 2025

PAN: Pillars-Attention-Based Network for 3D Object Detection

188

19 Sep 2025

RaFD: Flow-Guided Radar Detection for Robust Autonomous Driving

121

18 Sep 2025

BEVUDA++: Geometric-aware Unsupervised Domain Adaptation for Multi-View 3D Object Detection

136

17 Sep 2025

FishBEV: Distortion-Resilient Bird's Eye View Segmentation with Surround-View Fisheye Cameras

139

17 Sep 2025

Maps for Autonomous Driving: Full-process Survey and Frontiers

139

16 Sep 2025

SPHERE: Semantic-PHysical Engaged REpresentation for 3D Semantic Scene Completion

Zhiwen Yang

Yuxin Peng

3DGS

204

14 Sep 2025

CaR1: A Multi-Modal Baseline for BEV Vehicle Segmentation via Camera-Radar Fusion

Santiago Montiel-Marín

Ángel Llamazares

Miguel Antunes-García

Fabio Sánchez-García

L. Bergasa

147

12 Sep 2025

Towards Confidential and Efficient LLM Inference with Dual Privacy Protection

11 Sep 2025

Semantic Causality-Aware Vision-Based 3D Occupancy Prediction

129

10 Sep 2025

InsFusion: Rethink Instance-level LiDAR-Camera Fusion for 3D Object Detection

183

10 Sep 2025

Asymmetry Vulnerability and Physical Attacks on Online Map Construction for Autonomous Driving

132

07 Sep 2025

CRAB: Camera-Radar Fusion for Reducing Depth Ambiguity in Backward Projection based View TransformationIEEE International Conference on Robotics and Automation (ICRA), 2025

136

06 Sep 2025

Vehicle-to-Infrastructure Collaborative Spatial Perception via Multimodal Large Language Models

Kimia Ehsani

Walid Saad

118

04 Sep 2025

SliceSemOcc: Vertical Slice Based Multimodal 3D Semantic Occupancy Representation

115

04 Sep 2025

Mapping like a Skeptic: Probabilistic BEV Projection for Online HD Mapping

Fatih Erdoğan

Merve Rabia Barın

Fatma Guney

113

29 Aug 2025

SKGE-SWIN: End-To-End Autonomous Vehicle Waypoint Prediction and Navigation Using Skip Stage Swin Transformer

Fachri Najm Noer Kartiman

28 Aug 2025

OpenM3D: Open Vocabulary Multi-view Indoor 3D Object Detection without Human Annotations

111

27 Aug 2025

PseudoMapTrainer: Learning Online Mapping without HD Maps

Christian Lowens

Thorben Funke

Jingchao Xie

Alexandru Paul Condurache

108

26 Aug 2025

SAMFusion: Sensor-Adaptive Multimodal Fusion for 3D Object Detection in Adverse WeatherEuropean Conference on Computer Vision (ECCV), 2025

202

22 Aug 2025

RCDINO: Enhancing Radar-Camera 3D Object Detection with DINOv2 Semantic Features

Olga Matykina

Dmitry Yudin

114

21 Aug 2025

RATopo: Improving Lane Topology Reasoning via Redundancy Assignment

21 Aug 2025

Adversarial Generation and Collaborative Evolution of Safety-Critical Scenarios for Autonomous Vehicles

184

20 Aug 2025

MoVieDrive: Multi-Modal Multi-View Urban Scene Video Generation

137

20 Aug 2025

Self-Supervised Sparse Sensor Fusion for Long Range Perception

150

19 Aug 2025

Refine-and-Contrast: Adaptive Instance-Aware BEV Representations for Multi-UAV Collaborative Object Detection

102

18 Aug 2025

Neural Rendering for Sensor Adaptation in 3D Object Detection

144

18 Aug 2025

CMF-IoU: Multi-Stage Cross-Modal Fusion 3D Object Detection with IoU Joint Prediction

109

18 Aug 2025

An Initial Study of Bird's-Eye View Generation for Autonomous Vehicles using Cross-View Transformers

Felipe Carlos dos Santos

Eric A. Antonelo

Gustavo Claudio Karl Couto

17 Aug 2025

OmniD: Generalizable Robot Manipulation Policy via Image-Based BEV Representation

105

16 Aug 2025

CHARM3R: Towards Unseen Camera Height Robust Monocular 3D Detector

214

15 Aug 2025

CBDES MoE: Hierarchically Decoupled Mixture-of-Experts for Functional Modules in Autonomous Driving

142

11 Aug 2025

Understanding Dynamic Scenes in Ego Centric 4D Point Clouds

244

10 Aug 2025

ForeSight: Multi-View Streaming Joint Object Detection and Trajectory Forecasting

156

09 Aug 2025

CLIPVehicle: A Unified Framework for Vision-based Vehicle Search

145

06 Aug 2025

Efficient Inter-Task Attention for Multitask Transformer Models

150

06 Aug 2025

Occupancy Learning with Spatiotemporal Memory

171

06 Aug 2025

BEVCon: Advancing Bird's Eye View Perception with Contrastive LearningIEEE Robotics and Automation Letters (IEEE RA-L), 2025

139

06 Aug 2025

mmWave Radar-Based Non-Line-of-Sight Pedestrian Localization at T-Junctions Utilizing Road Layout Extraction via Camera

114

04 Aug 2025

A Coarse-to-Fine Approach to Multi-Modality 3D Occupancy Grounding

274

02 Aug 2025

CoST: Efficient Collaborative Perception From Unified Spatiotemporal Perspective

184

01 Aug 2025

3D-MOOD: Lifting 2D to 3D for Monocular Open-Set Object Detection

256

31 Jul 2025

FASTopoWM: Fast-Slow Lane Segment Topology Reasoning with Latent World Models

373

31 Jul 2025

MapDiffusion: Generative Diffusion for Vectorized Online HD Map Construction and Uncertainty Estimation in Autonomous Driving

174

29 Jul 2025

GTAD: Global Temporal Aggregation Denoising Learning for 3D Semantic Occupancy Prediction

122

28 Jul 2025

Collaborative Perceiver: Elevating Vision-based 3D Object Detection via Local Density-Aware Spatial Occupancy

334

28 Jul 2025