v1v2 (latest)

BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

European Conference on Computer Vision (ECCV), 2022

31 March 2022

ArXiv (abs)PDF HTML Github (18★)

Papers citing "BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers"

50 / 973 papers shown

SuperFusion: Multilevel LiDAR-Camera Fusion for Long-Range HD Map GenerationIEEE International Conference on Robotics and Automation (ICRA), 2022

Xieyuanli Chen

295

28 Nov 2022

BEV-Locator: An End-to-end Visual Semantic Localization Network Using Multi-View ImagesScience China Information Sciences (Sci. China Inf. Sci.), 2022

208

27 Nov 2022

3DPPE: 3D Point Positional Encoding for Multi-Camera 3D Object Detection Transformers

280

27 Nov 2022

3D Dual-Fusion: Dual-Domain Dual-Query Camera-LiDAR Fusion for 3D Object Detection

228

24 Nov 2022

AeDet: Azimuth-invariant Multi-view 3D Object DetectionComputer Vision and Pattern Recognition (CVPR), 2022

Yujie Zhong

128

22 Nov 2022

Uncertainty-aware Vision-based Metric Cross-view GeolocalizationComputer Vision and Pattern Recognition (CVPR), 2022

180

22 Nov 2022

MatrixVT: Efficient Multi-Camera to BEV Transformation for 3D PerceptionIEEE International Conference on Computer Vision (ICCV), 2022

Hongyu Zhou

Zheng Ge

Zeming Li

Xiangyu Zhang

155

19 Nov 2022

Sparse4D: Multi-view 3D Object Detection with Sparse Spatial-Temporal Fusion

308

154

19 Nov 2022

BEVFormer v2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective SupervisionComputer Vision and Pattern Recognition (CVPR), 2022

...

Yu Qiao

226

376

18 Nov 2022

BEVDistill: Cross-Modal BEV Distillation for Multi-View 3D Object DetectionInternational Conference on Learning Representations (ICLR), 2022

302

17 Nov 2022

Monocular BEV Perception of Road Scenes via Front-to-Top View ProjectionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Yuexin Ma

162

15 Nov 2022

Structured Knowledge Distillation Towards Efficient and Compact Multi-View 3D Detection

257

14 Nov 2022

Recursive Cross-View: Use Only 2D Detectors to Achieve 3D Object Detection without 3D AnnotationsIEEE Robotics and Automation Letters (RA-L), 2022

Shun Gui

Yan Luximon

344

14 Nov 2022

Behavioral Intention Prediction in Driving Scenes: A Survey

Jianwu Fang

Fan Wang

Jianru Xue

Tat-Seng Chua

454

01 Nov 2022

Multi-Camera Calibration Free BEV Representation for 3D Object Detection

186

31 Oct 2022

PlanT: Explainable Planning Transformers via Object-Level RepresentationsConference on Robot Learning (CoRL), 2022

A. Sophia Koepke

273

128

25 Oct 2022

CramNet: Camera-Radar Fusion with Ray-Constrained Cross-Attention for Robust 3D Object DetectionEuropean Conference on Computer Vision (ECCV), 2022

Henrik Kretzschmar

252

17 Oct 2022

Model-Based Imitation Learning for Urban DrivingNeural Information Processing Systems (NeurIPS), 2022

Gianluca Corrado

Hudson Yeo

Alex Kendall

R. Cipolla

Jamie Shotton

338

188

14 Oct 2022

X-Align: Cross-Modal Cross-View Alignment for Bird's-Eye-View SegmentationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Shubhankar Borse

Fatih Porikli

282

13 Oct 2022

Exploring Contextual Representation and Multi-Modality for End-to-End Autonomous DrivingEngineering applications of artificial intelligence (EAAI), 2022

Shoaib Azam

Farzeen Munir

Ville Kyrki

M. Jeon

Witold Pedrycz

216

13 Oct 2022

BEV-LaneDet: a Simple and Effective 3D Lane Detection Baseline

248

12 Oct 2022

Depth Is All You Need for Monocular 3D DetectionIEEE International Conference on Robotics and Automation (ICRA), 2022

Dennis Park

Jie Li

Di Chen

Vitor Campagnolo Guizilini

Adrien Gaidon

3DPC MDE

219

05 Oct 2022

Time Will Tell: New Outlooks and A Baseline for Temporal Multi-View 3D Object DetectionInternational Conference on Learning Representations (ICLR), 2022

Wei Zhan

291

208

05 Oct 2022

CrossDTR: Cross-view and Depth-guided Transformers for 3D Object DetectionIEEE International Conference on Robotics and Automation (ICRA), 2022

Hsin-Ying Lee

271

27 Sep 2022

Center Feature Fusion: Selective Multi-Sensor Fusion of Center-based ObjectsIEEE International Conference on Robotics and Automation (ICRA), 2022

Wei Zhan

173

26 Sep 2022

FusionRCNN: LiDAR-Camera Fusion for Two-stage 3D Object DetectionRemote Sensing (RS), 2022

296

22 Sep 2022

BEVStereo: Enhancing Depth Estimation in Multi-view 3D Object Detection with Dynamic Temporal Stereo

270

120

21 Sep 2022

GATraj: A Graph- and Attention-based Multi-Agent Trajectory Prediction ModelIsprs Journal of Photogrammetry and Remote Sensing (JIPRS), 2022

281

16 Sep 2022

CRAFT: Camera-Radar 3D Object Detection with Spatio-Contextual Fusion TransformerAAAI Conference on Artificial Intelligence (AAAI), 2022

383

118

14 Sep 2022

^2

-3DLaneNet: Exploring Multi-Modal 3D Lane Detection

169

13 Sep 2022

Delving into the Devils of Bird's-eye-view Perception: A Review, Evaluation and RecipeIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

...

Yu Qiao

321

189

12 Sep 2022

MapTR: Structured Modeling and Learning for Online Vectorized HD Map ConstructionInternational Conference on Learning Representations (ICLR), 2022

324

330

30 Aug 2022

DeepInteraction: 3D Object Detection via Modality InteractionNeural Information Processing Systems (NeurIPS), 2022

Li Zhang

374

189

23 Aug 2022

Quality Matters: Embracing Quality Clues for Robust 3D Multi-Object Tracking

265

23 Aug 2022

STS: Surround-view Temporal Stereo for Multi-view 3D Detection

177

22 Aug 2022

A Simple Baseline for Multi-Camera 3D Object DetectionAAAI Conference on Artificial Intelligence (AAAI), 2022

Jie Zhou

172

22 Aug 2022

Exploring Point-BEV Fusion for 3D Point Cloud Object Tracking with TransformerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Ziwei Liu

210

10 Aug 2022

Vision-Centric BEV Perception: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Yuexin Ma

Yu Qiao

Xinge Zhu

545

177

04 Aug 2022

ViP3D: End-to-end Visual Trajectory Prediction via 3D Agent QueriesComputer Vision and Pattern Recognition (CVPR), 2022

Yue Wang

Hang Zhao

327

119

02 Aug 2022

Group DETR: Fast DETR Training with Group-Wise One-to-Many AssignmentIEEE International Conference on Computer Vision (ICCV), 2022

Errui Ding

Jingdong Wang

304

195

26 Jul 2022

DETRs with Hybrid MatchingComputer Vision and Pattern Recognition (CVPR), 2022

452

258

26 Jul 2022

MV-FCOS3D++: Multi-View Camera-Only 4D Object Detection with Pretrained Monocular Backbones

Xinge Zhu

113

26 Jul 2022

UniFusion: Unified Multi-view Fusion Transformer for Spatial-Temporal Representation in Bird's-Eye-ViewIEEE International Conference on Computer Vision (ICCV), 2022

Xi Li

173

18 Jul 2022

Consistency of Implicit and Explicit Features Matters for Monocular 3D Object Detection

201

16 Jul 2022

ST-P3: End-to-end Vision-based Autonomous Driving via Spatial-Temporal Feature LearningEuropean Conference on Computer Vision (ECCV), 2022

Shengchao Hu

Li Chen

279

376

15 Jul 2022

Trans4Map: Revisiting Holistic Bird's-Eye-View Mapping from Egocentric Images to Allocentric Semantics with Vision TransformersIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Kailun Yang

154

13 Jul 2022

CoBEVT: Cooperative Bird's Eye View Semantic Segmentation with Sparse TransformersConference on Robot Learning (CoRL), 2022

Jiaqi Ma

409

307

05 Jul 2022

Vision-based Uneven BEV Representation Learning with Polar Rasterization and Surface EstimationConference on Robot Learning (CoRL), 2022

127

05 Jul 2022

ORA3D: Overlap Region Aware Multi-view 3D Object DetectionBritish Machine Vision Conference (BMVC), 2022

238

02 Jul 2022

Masked Autoencoder for Self-Supervised Pre-training on Lidar Point Clouds

Christoffer Petersson

Lennart Svensson

3DPC ViT

283

01 Jul 2022