Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models

Drive Anywhere: Generalizable End-to-end Autonomous Driving with Multi-modal Foundation Models

26 October 2023

Tsun-Hsuan Wang

Wei Xiao

Alexander Amini

Daniela Rus

Papers citing "Drive Anywhere: Generalizable End-to-end Autonomous Driving with Multi-modal Foundation Models"

11 / 11 papers shown

Title
LangCoop: Collaborative Driving with Language Xiangbo Gao Yuheng Wu Rujia Wang Chenxi Liu Yang Zhou Zhengzhong Tu VLM 32 0 0 18 Apr 2025
RS2AD: End-to-End Autonomous Driving Data Generation from Roadside Sensor Observations Ruidan Xing Runyi Huang Qing Xu Lei He 56 0 0 10 Mar 2025
DriveLM: Driving with Graph Visual Question Answering Chonghao Sima Katrin Renz Kashyap Chitta L. Chen Hanxue Zhang Chengen Xie Jens Beißwenger Ping Luo Andreas Geiger Hongyang Li 68 159 0 17 Jan 2025
ROADWork Dataset: Learning to Recognize, Observe, Analyze and Drive Through Work Zones Anurag Ghosh R. Tamburo Shen Zheng Juan R. Alvarez-Padilla Hailiang Zhu Michael Cardei Nicholas Dunn Christoph Mertz Srinivasa G. Narasimhan 31 1 0 11 Jun 2024
Talk2Radar: Bridging Natural Language with 4D mmWave Radar for 3D Referring Expression Comprehension Runwei Guan Ruixiao Zhang Ningwei Ouyang Jianan Liu Ka Lok Man ... Ming Xu Jeremy S. Smith Eng Gee Lim Yutao Yue Hui Xiong 46 8 0 21 May 2024
Audio Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard VGen 55 18 0 13 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 380 4,010 0 28 Jan 2022
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 283 5,723 0 29 Apr 2021
The Power of Scale for Parameter-Efficient Prompt Tuning Brian Lester Rami Al-Rfou Noah Constant VPVLM 275 3,784 0 18 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,735 0 24 Feb 2021