Discuss Before Moving: Visual Language Navigation via Multi-expert Discussions

20 September 2023

Papers citing "Discuss Before Moving: Visual Language Navigation via Multi-expert Discussions"

43 / 43 papers shown

Title
VISTA: Generative Visual Imagination for Vision-and-Language Navigation Yanjia Huang M. Wu Renjie Li Zhengzhong Tu LM&Ro 21 0 0 09 May 2025
3DWG: 3D Weakly Supervised Visual Grounding via Category and Instance-Level Alignment X. Li J. H. Liu Nuowei Han Liang Heng Y. Guo Hao Dong Yang Liu 66 0 0 03 May 2025
Think Hierarchically, Act Dynamically: Hierarchical Multi-modal Fusion and Reasoning for Vision-and-Language Navigation Junrong Yue Y. Zhang Chuan Qin Bo Li Xiaomin Lie Xinlei Yu Wenxin Zhang Zhendong Zhao 43 0 0 23 Apr 2025
Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation Ziming Wei Bingqian Lin Yunshuang Nie Jiaqi Chen Shikui Ma Hang Xu Xiaodan Liang 56 0 0 23 Mar 2025
Safety Aware Task Planning via Large Language Models in Robotics A. Khan Michael Andrev Muhammad Ali Murtaza Sergio Aguilera Rui Zhang Jie Ding Seth Hutchinson Ali Anwar LLMAG 51 3 0 19 Mar 2025
FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks Siqi Zhang Yanyuan Qiao Qunbo Wang Longteng Guo Zhihua Wei J. Liu LM&Ro 74 0 0 18 Mar 2025
Beyond the Destination: A Novel Benchmark for Exploration-Aware Embodied Question Answering Kaixuan Jiang Y. Liu Weixing Chen Jingzhou Luo Ziliang Chen Ling Pan G. Li Liang Lin 51 2 0 14 Mar 2025
SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation Xiangyu Shi Zerui Li Wenqi Lyu Jiatong Xia Feras Dayoub Yanyuan Qiao Qi Wu 46 0 0 13 Mar 2025
UniGoal: Towards Universal Zero-shot Goal-oriented Navigation Hang Yin Xiuwei Xu Lingqing Zhao Z. Wang Jie Zhou Jiwen Lu 73 2 0 13 Mar 2025
Mobile Robot Navigation Using Hand-Drawn Maps: A Vision Language Model Approach A. H. Tan Angus Fung Haitong Wang G. Nejat 87 2 0 31 Jan 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Mohit Bansal Parisa Kordjamshidi LRM 51 18 0 31 Dec 2024
VLN-Game: Vision-Language Equilibrium Search for Zero-Shot Semantic Navigation Bangguo Yu Yuzhen Liu Lei Han H. Kasaei Tingguang Li M. Cao LM&Ro 67 2 0 18 Nov 2024
ImagineNav: Prompting Vision-Language Models as Embodied Navigator through Scene Imagination Xinxin Zhao Wenzhe Cai Likun Tang Teng Wang LM&Ro 32 3 0 13 Oct 2024
PANav: Toward Privacy-Aware Robot Navigation via Vision-Language Models Bangguo Yu H. Kasaei Ming Cao 27 0 0 05 Oct 2024
MO-DDN: A Coarse-to-Fine Attribute-based Exploration Agent for Multi-object Demand-driven Navigation Hongcheng Wang Peiqi Liu Wenzhe Cai Mingdong Wu Zhengyu Qian Hao Dong 21 0 0 04 Oct 2024
MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents Junpeng Yue Xinru Xu Börje F. Karlsson Zongqing Lu 32 0 0 04 Oct 2024
Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs Yanyuan Qiao Wenqi Lyu Hui Wang Zixu Wang Zerui Li Yuan Zhang Mingkui Tan Qi Wu LRM 36 2 0 27 Sep 2024
Navigating the Nuances: A Fine-grained Evaluation of Vision-Language Navigation Zehao Wang Minye Wu Yixin Cao Yubo Ma Meiqi Chen Tinne Tuytelaars 25 1 0 25 Sep 2024
MultiTalk: Introspective and Extrospective Dialogue for Human-Environment-LLM Alignment Venkata Naren Devarakonda Ali Umut Kaypak Shuaihang Yuan P. Krishnamurthy Yi Fang Farshad Khorrami LLMAG 42 0 0 24 Sep 2024
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models Kehui Liu Zixin Tang Dong Wang Z. Wang Bin Zhao Bin Zhao 29 10 0 23 Sep 2024
AppAgent v2: Advanced Agent for Flexible Mobile Interactions Yanda Li Chi Zhang Wanqi Yang Bin-Bin Fu Pei Cheng Xin Chen Ling Chen Yunchao Wei LLMAG LM&Ro 31 9 0 05 Aug 2024
AI-Gadget Kit: Integrating Swarm User Interfaces with LLM-driven Agents for Rich Tabletop Game Applications Yijie Guo Zhenhan Huang Ruhan Wang Zhihao Yao Tianyu Yu Zhiling Xu Xinyu Zhao Xueqing Li Haipeng Mi 34 2 0 24 Jul 2024
DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control Xinyu Xu Shengcheng Luo Yanchao Yang Yong-Lu Li Cewu Lu LM&Ro 33 1 0 20 Jul 2024
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models Gengze Zhou Yicong Hong Zun Wang Xin Eric Wang Qi Wu LM&Ro 42 18 0 17 Jul 2024
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI Y. Liu Weixing Chen Yongjie Bai Xiaodan Liang Guanbin Li Wen Gao Liang Lin LM&Ro SyDa AI4CE 48 47 0 09 Jul 2024
RoboCAS: A Benchmark for Robotic Manipulation in Complex Object Arrangement Scenarios Liming Zheng Feng Yan Fanfan Liu Chengjian Feng Zhuoliang Kang Lin Ma 38 2 0 09 Jul 2024
Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation Jiaqi Chen Bingqian Lin Xinmin Liu Lin Ma Xiaodan Liang Kwan-Yee Kenneth Wong LM&Ro 44 8 0 08 Jul 2024
Human-centered In-building Embodied Delivery Benchmark Zhuoqun Xu Yang Liu Xiaoqi Li Jiyao Zhang Hao Dong 40 0 0 25 Jun 2024
Sim-to-Real Transfer via 3D Feature Fields for Vision-and-Language Navigation Zihan Wang Xiangyang Li Jiahao Yang Yeqi Liu Shuqiang Jiang LM&Ro 27 5 0 14 Jun 2024
IVLMap: Instance-Aware Visual Language Grounding for Consumer Robot Navigation Jiacui Huang Hongtao Zhang Mingbo Zhao Zhou Wu LM&Ro 21 5 0 28 Mar 2024
NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning Bingqian Lin Yunshuang Nie Ziming Wei Jiaqi Chen Shikui Ma Jianhua Han Hang Xu Xiaojun Chang Xiaodan Liang LM&Ro LRM 60 19 0 12 Mar 2024
NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation Jiazhao Zhang Kunyu Wang Rongtao Xu Gengze Zhou Yicong Hong Xiaomeng Fang Qi Wu Zhizheng Zhang Wang He LM&Ro 32 44 0 24 Feb 2024
Large Multimodal Agents: A Survey Junlin Xie Zhihong Chen Ruifei Zhang Xiang Wan Guanbin Li LM&Ro LLMAG 37 38 0 23 Feb 2024
MapGPT: Map-Guided Prompting with Adaptive Path Planning for Vision-and-Language Navigation Jiaqi Chen Bingqian Lin Ran Xu Zhenhua Chai Xiaodan Liang Kwan-Yee Kenneth Wong LM&Ro LLMAG 31 26 0 14 Jan 2024
ThinkBot: Embodied Instruction Following with Thought Chain Reasoning Guanxing Lu Ziwei Wang Changliu Liu Jiwen Lu Yansong Tang LRM 25 8 0 12 Dec 2023
CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation Xiwen Liang Liang Ma Shanshan Guo Jianhua Han Hang Xu Shikui Ma Xiaodan Liang LM&Ro LLMAG 79 4 0 17 Jun 2023
Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard LM&Ro 145 340 0 11 Oct 2022
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action Dhruv Shah B. Osinski Brian Ichter Sergey Levine LM&Ro 139 435 0 10 Jul 2022
Large Language Models are Zero-Shot Reasoners Takeshi Kojima S. Gu Machel Reid Yutaka Matsuo Yusuke Iwasawa ReLM LRM 291 4,048 0 24 May 2022
Self-Consistency Improves Chain of Thought Reasoning in Language Models Xuezhi Wang Jason W. Wei Dale Schuurmans Quoc Le Ed H. Chi Sharan Narang Aakanksha Chowdhery Denny Zhou ReLM BDL LRM AI4CE 297 3,217 0 21 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,402 0 28 Jan 2022
TEACh: Task-driven Embodied Agents that Chat Aishwarya Padmakumar Jesse Thomason Ayush Shrivastava P. Lange Anjali Narayan-Chen Spandana Gella Robinson Piramithu Gökhan Tür Dilek Z. Hakkani-Tür LM&Ro 155 180 0 01 Oct 2021
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 246 495 0 07 Jun 2018