Multimodal Large Language Model for Visual Navigation

12 October 2023

Papers citing "Multimodal Large Language Model for Visual Navigation"

6 / 6 papers shown

Title
L3MVN: Leveraging Large Language Models for Visual Target Navigation Bangguo Yu H. Kasaei M. Cao LM&Ro 40 83 0 11 Apr 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard LM&Ro 140 337 0 11 Oct 2022
Habitat-Matterport 3D Semantics Dataset Karmesh Yadav Ram Ramrakhya Santhosh Kumar Ramakrishnan Theo Gervet John Turner ... Angel X. Chang Dhruv Batra Manolis Savva Alexander William Clegg Devendra Singh Chaplot 3DV MDE 73 81 0 11 Oct 2022
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action Dhruv Shah B. Osinski Brian Ichter Sergey Levine LM&Ro 136 430 0 10 Jul 2022
ORB-SLAM2: an Open-Source SLAM System for Monocular, Stereo and RGB-D Cameras Raul Mur-Artal Juan D. Tardós 191 4,837 0 20 Oct 2016