Improving Vision-and-Language Navigation by Generating Future-View Image Semantics

11 April 2023

Papers citing "Improving Vision-and-Language Navigation by Generating Future-View Image Semantics"

28 / 28 papers shown

Title
CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory Weichen Zhang Chen Gao Shiquan Yu Ruiying Peng Baining Zhao Qian Zhang Jinqiang Cui Xinlei Chen Y. Li LLMAG LM&Ro 37 0 0 08 May 2025
ST-Booster: An Iterative SpatioTemporal Perception Booster for Vision-and-Language Navigation in Continuous Environments Lu Yue Dongliang Zhou Liang Xie Erwei Yin Feitian Zhang 34 0 0 14 Apr 2025
COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation Siqi Zhang Yanyuan Qiao Qunbo Wang Zike Yan Qi Wu Zhihua Wei J. Liu 48 0 0 31 Mar 2025
Do Visual Imaginations Improve Vision-and-Language Navigation Agents? Akhil Perincherry Jacob Krantz Stefan Lee LM&Ro 39 0 0 20 Mar 2025
Knowing Your Target: Target-Aware Transformer Makes Better Spatio-Temporal Video Grounding Xin Gu Yaojie Shen Chenxi Luo Tiejian Luo Yan Huang Yuewei Lin Heng Fan L. Zhang 50 1 0 16 Feb 2025
REGNav: Room Expert Guided Image-Goal Navigation Pengna Li Kangyi Wu Jingwen Fu Sanping Zhou 41 0 0 15 Feb 2025
Vision-Language Models for Edge Networks: A Comprehensive Survey Ahmed Sharshar Latif U. Khan Waseem Ullah Mohsen Guizani VLM 62 2 0 11 Feb 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Mohit Bansal Parisa Kordjamshidi LRM 51 17 0 31 Dec 2024
NaVIP: An Image-Centric Indoor Navigation Solution for Visually Impaired People Jun Yu Yifan Zhang Badrinadh Aila V. Namboodiri 28 1 0 08 Oct 2024
Visual-O1: Understanding Ambiguous Instructions via Multi-modal Multi-turn Chain-of-thoughts Reasoning Minheng Ni Yutao Fan Lei Zhang Wangmeng Zuo LRM AI4CE 24 6 0 04 Oct 2024
Navigating Beyond Instructions: Vision-and-Language Navigation in Obstructed Environments Haodong Hong Sen Wang Zi Huang Qi Wu Jiajun Liu 30 1 0 31 Jul 2024
Correctable Landmark Discovery via Large Models for Vision-Language Navigation Bingqian Lin Yunshuang Nie Ziming Wei Yi Zhu Hang Xu Shikui Ma Jianzhuang Liu Xiaodan Liang LM&Ro 29 6 0 29 May 2024
Vision-and-Language Navigation via Causal Learning Liuyi Wang Zongtao He Ronghao Dang Mengjiao Shen Chengju Liu Qijun Chen CML 36 13 0 16 Apr 2024
Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation Zihan Wang Xiangyang Li Jiahao Yang Yeqi Liu Junjie Hu Ming Jiang Shuqiang Jiang 37 15 0 02 Apr 2024
OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation Ganlong Zhao Guanbin Li Weikai Chen Yizhou Yu 19 4 0 26 Mar 2024
VisionGPT: LLM-Assisted Real-Time Anomaly Detection for Safe Visual Navigation Hao Wang Jiayou Qin Ashish Bastola Xiwen Chen John Suchanek Zihao Gong Abolfazl Razi 24 14 0 19 Mar 2024
Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation X. Lei Min Wang Wen-gang Zhou Li Li Houqiang Li 25 5 0 25 Feb 2024
NavHint: Vision and Language Navigation Agent with a Hint Generator Yue Zhang Quan Guo Parisa Kordjamshidi LLMAG 23 9 0 04 Feb 2024
Towards Learning a Generalist Model for Embodied Navigation Duo Zheng Shijia Huang Lin Zhao Yiwu Zhong Liwei Wang LM&Ro 25 40 0 04 Dec 2023
Fast-Slow Test-Time Adaptation for Online Vision-and-Language Navigation Junyu Gao Xuan Yao Changsheng Xu TTA 20 3 0 22 Nov 2023
Interactive Semantic Map Representation for Skill-based Visual Object Navigation T. Zemskova A. Staroverov K. Muravyev Dmitry A. Yudin Aleksandr I. Panov 24 2 0 07 Nov 2023
Scaling Data Generation in Vision-and-Language Navigation Zun Wang Jialu Li Yicong Hong Yi Wang Qi Wu Mohit Bansal Stephen Gould Hao Tan Yu Qiao LM&Ro 14 54 0 28 Jul 2023
PanoGen: Text-Conditioned Panoramic Environment Generation for Vision-and-Language Navigation Jialu Li Mohit Bansal DiffM 24 48 0 30 May 2023
Masked Path Modeling for Vision-and-Language Navigation Zi-Yi Dou Feng Gao Nanyun Peng LM&Ro 13 3 0 23 May 2023
ESceme: Vision-and-Language Navigation with Episodic Scene Memory Qinjie Zheng Daqing Liu Chaoyue Wang Jing Zhang Dadong Wang Dacheng Tao LM&Ro 22 5 0 02 Mar 2023
BEVBert: Multimodal Map Pre-training for Language-guided Navigation Dongyan An Yuankai Qi Yangguang Li Yan Huang Liangsheng Wang T. Tan Jing Shao 25 55 0 08 Dec 2022
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,735 0 24 Feb 2021
Language and Visual Entity Relationship Graph for Agent Navigation Yicong Hong Cristian Rodriguez-Opazo Yuankai Qi Qi Wu Stephen Gould LM&Ro 160 131 0 19 Oct 2020