v1v2v3 (latest)

Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension

21 May 2024

ArXiv (abs)PDF HTML Github (44★)

Papers citing "Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension"

50 / 61 papers shown

AerialMind: Towards Referring Multi-Object Tracking in UAV Scenarios

389

26 Nov 2025

RoadSceneVQA: Benchmarking Visual Question Answering in Roadside Perception Systems for Intelligent Transportation System

...

174

23 Nov 2025

DVLO4D: Deep Visual-Lidar Odometry with Sparse Spatial-temporal FusionIEEE International Conference on Robotics and Automation (ICRA), 2025

199

07 Sep 2025

A Coarse-to-Fine Approach to Multi-Modality 3D Occupancy Grounding

353

02 Aug 2025

AI2MMUM: AI-AI Oriented Multi-Modal Universal Model Leveraging Telecom Domain Large ModelIEEE Wireless Communications Letters (WCL), 2025

...

200

15 May 2025

Talk2PC: Enhancing 3D Visual Grounding through LiDAR and Radar Point Clouds Fusion for Autonomous Driving

...

363

11 Mar 2025

MetaOcc: Spatio-Temporal Fusion of Surround-View 4D Radar and Camera for 3D Occupancy Prediction with Dual Training Strategies

...

993

26 Jan 2025

DriveLM: Driving with Graph Visual Question AnsweringEuropean Conference on Computer Vision (ECCV), 2023

Chonghao Sima

Katrin Renz

Kashyap Chitta

Lawrence Yunliang Chen

953

439

17 Jan 2025

RadarNeXt: Real-Time and Reliable 3D Object Detector Based On 4D mmWave Imaging Radar

453

04 Jan 2025

radarODE-MTL: A Multi-Task Learning Framework with Eccentric Gradient Alignment for Robust Radar-Based ECG ReconstructionIEEE Transactions on Instrumentation and Measurement (IEEE Trans. Instrum. Meas.), 2024

377

11 Oct 2024

radarODE: An ODE-Embedded Deep Learning Model for Contactless ECG Reconstruction from Millimeter-Wave RadarIEEE Transactions on Mobile Computing (IEEE TMC), 2024

361

03 Aug 2024

A Survey on Text-guided 3D Visual Grounding: Elements, Recent Advances, and Future DirectionsIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2024

Wei Hu

419

09 Jun 2024

Radar Spectra-Language Model for Automotive Scene Parsing

322

04 Jun 2024

DPFT: Dual Perspective Fusion Transformer for Camera-Radar-based Object DetectionIEEE Transactions on Intelligent Vehicles (TIV), 2024

F. Fent

Andras Palffy

Holger Caesar

310

03 Apr 2024

DVLO: Deep Visual-LiDAR Odometry with Local-to-Global Feature Fusion and Bi-Directional Structure Alignment

Hesheng Wang

558

27 Mar 2024

RCBEVDet: Radar-camera Fusion in Bird's Eye View for 3D Object Detection

Zhiwei Lin

Le Zhang

332

130

25 Mar 2024

WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar

Shanliang Yao

...

452

19 Mar 2024

Large Multimodal Agents: A Survey

Xiang Wan

261

102

23 Feb 2024

LiDAR-LLM: Exploring the Potential of Large Language Models for 3D LiDAR Understanding

Shanghang Zhang

446

127

21 Dec 2023

Mono3DVG: 3D Visual Grounding in Monocular ImagesAAAI Conference on Artificial Intelligence (AAAI), 2023

Yangfan Zhan

Yuan. Yuan

Zhitong Xiong

MDE

295

13 Dec 2023

PillarNeSt: Embracing Backbone Scaling and Pretraining for Pillar-based 3D Object DetectionIEEE Transactions on Intelligent Vehicles (TIV), 2023

222

29 Nov 2023

A Survey on Multimodal Large Language Models for Autonomous Driving

Wenqian Ye

...

397

479

21 Nov 2023

Drive Anywhere: Generalizable End-to-end Autonomous Driving with Multi-modal Foundation ModelsIEEE International Conference on Robotics and Automation (ICRA), 2023

Wei Xiao

Daniela Rus

250

26 Oct 2023

Vision Language Models in Autonomous Driving: A Survey and OutlookIEEE Transactions on Intelligent Vehicles (TIV), 2023

361

160

22 Oct 2023

Language Prompt for Autonomous DrivingAAAI Conference on Artificial Intelligence (AAAI), 2023

Cheng-zhong Xu

541

143

08 Sep 2023

ASY-VRNet: Waterway Panoptic Driving Perception Model based on Asymmetric Fair Fusion of Vision and 4D mmWave RadarIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

Shanliang Yao

440

20 Aug 2023

SMURF: Spatial Multi-Representation Fusion for 3D Object Detection with 4D Imaging RadarIEEE Transactions on Intelligent Vehicles (TIV), 2023

514

112

20 Jul 2023

RCM-Fusion: Radar-Camera Multi-Level Fusion for 3D Object DetectionIEEE International Conference on Robotics and Automation (ICRA), 2023

672

17 Jul 2023

Achelous: A Fast Unified Water-surface Panoptic Perception Framework based on Fusion of Monocular Camera and 4D mmWave Radar

Shanliang Yao

252

14 Jul 2023

WaterScenes: A Multi-Task 4D Radar-Camera Fusion Dataset and Benchmarks for Autonomous Driving on Water Surfaces

Shanliang Yao

...

409

13 Jul 2023

LXL: LiDAR Excluded Lean 3D Object Detection with 4D Imaging Radar and Camera FusionIEEE Transactions on Intelligent Vehicles (TIV), 2023

568

115

03 Jul 2023

4D Millimeter-Wave Radar in Autonomous Driving: A Survey

Jianqiang Wang

552

07 Jun 2023

GRES: Generalized Referring Expression SegmentationComputer Vision and Pattern Recognition (CVPR), 2023

Chang Liu

Henghui Ding

Xudong Jiang

415

281

01 Jun 2023

Language-Guided 3D Object Detection in Point Cloud for Autonomous Driving

239

25 May 2023

PillarNeXt: Rethinking Network Designs for 3D Object Detection in LiDAR Point CloudsComputer Vision and Pattern Recognition (CVPR), 2023

404

145

08 May 2023

Radar-Camera Fusion for Object Detection and Semantic Segmentation in Autonomous Driving: A Comprehensive ReviewIEEE Transactions on Intelligent Vehicles (TIV), 2023

Shanliang Yao

...

313

205

20 Apr 2023

CRN: Camera Radar Net for Accurate, Robust, Efficient 3D PerceptionIEEE International Conference on Computer Vision (ICCV), 2023

719

125

03 Apr 2023

ViewRefer: Grasp the Multi-view Knowledge for 3D Visual Grounding with GPT and Prototype GuidanceIEEE International Conference on Computer Vision (ICCV), 2023

Xuelong Li

615

29 Mar 2023

VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and TrackingComputer Vision and Pattern Recognition (CVPR), 2023

Yukang Chen

Jianhui Liu

Xiangyu Zhang

Xiaojuan Qi

Jiaya Jia

3DPC

366

414

20 Mar 2023

Referring Multi-Object TrackingComputer Vision and Pattern Recognition (CVPR), 2023

Xiangyu Zhang

264

128

06 Mar 2023

LidarCLIP or: How I Learned to Talk to Point CloudsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Georg Hess

Adam Tonderski

Christoffer Petersson

Kalle AAstrom

Lennart Svensson

DiffM

409

13 Dec 2022

Language Conditioned Spatial Relation Reasoning for 3D Object GroundingNeural Information Processing Systems (NeurIPS), 2022

337

145

17 Nov 2022

RaLiBEV: Radar and LiDAR BEV Fusion Learning for Anchor Box Free Object Detection Systems

471

11 Nov 2022

InternImage: Exploring Large-Scale Vision Foundation Models with Deformable ConvolutionsComputer Vision and Pattern Recognition (CVPR), 2022

...

Yu Qiao

648

1,046

10 Nov 2022

EDA: Explicit Text-Decoupling and Dense Alignment for 3D Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2022

Yanmin Wu

Xinhua Cheng

Renrui Zhang

Zesen Cheng

Jian Zhang

405

119

29 Sep 2022

CenterFormer: Center-based Transformer for 3D Object DetectionEuropean Conference on Computer Vision (ECCV), 2022

254

192

12 Sep 2022

K-Radar: 4D Radar Object Detection for Autonomous Driving in Various Weather ConditionsNeural Information Processing Systems (NeurIPS), 2022

Dong-Hee Paek

Seung-Hyun Kong

Kevin Tirta Wijaya

631

186

16 Jun 2022

Multi-View Transformer for 3D Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2022

456

188

05 Apr 2022

Deep Instance Segmentation with Automotive Radar Detection Points

Wanli Ouyang

466

05 Oct 2021

YOLOX: Exceeding YOLO Series in 2021

861

5,590

18 Jul 2021