Topological Planning with Transformers for Vision-and-Language Navigation

9 December 2020

Silvio Savarese

Papers citing "Topological Planning with Transformers for Vision-and-Language Navigation"

20 / 20 papers shown

Title
CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory Weichen Zhang Chen Gao Shiquan Yu Ruiying Peng Baining Zhao Qian Zhang Jinqiang Cui Xinlei Chen Y. Li LLMAG LM&Ro 42 0 0 08 May 2025
Prior Does Matter: Visual Navigation via Denoising Diffusion Bridge Models Hao Ren Yiming Zeng Zetong Bi Zhaoliang Wan Junlong Huang Hui Cheng 99 1 0 14 Apr 2025
Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models Yue Zhang Ziqiao Ma Jialu Li Yanyuan Qiao Zun Wang J. Chai Qi Wu Mohit Bansal Parisa Kordjamshidi LRM 51 18 0 31 Dec 2024
MemoNav: Working Memory Model for Visual Navigation Hongxin Li Zeyu Wang Xueke Yang Yu-Ren Yang Shuqi Mei Zhaoxiang Zhang 31 5 0 29 Feb 2024
GridMM: Grid Memory Map for Vision-and-Language Navigation Zihan Wang Xiangyang Li Jiahao Yang Yeqi Liu Shuqiang Jiang 26 50 0 24 Jul 2023
NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models Gengze Zhou Yicong Hong Qi Wu ELM LM&Ro LLMAG LRM 23 139 0 26 May 2023
Improving Vision-and-Language Navigation by Generating Future-View Image Semantics Jialu Li Mohit Bansal 21 34 0 11 Apr 2023
Graph Transformer GANs for Graph-Constrained House Generation H. Tang Zhenyu Zhang Humphrey Shi Bo-wen Li Lin Shao N. Sebe Radu Timofte Luc Van Gool 34 19 0 14 Mar 2023
Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language Navigation Peihao Chen Dongyu Ji Kun-Li Channing Lin Runhao Zeng Thomas H. Li Mingkui Tan Chuang Gan SSL 20 61 0 14 Oct 2022
Learning Active Camera for Multi-Object Navigation Peihao Chen Dongyu Ji Kun-Li Channing Lin Weiwen Hu Wenbing Huang Thomas H. Li Ming Tan Chuang Gan 25 24 0 14 Oct 2022
Iterative Vision-and-Language Navigation Jacob Krantz Shurjo Banerjee Wang Zhu Jason J. Corso Peter Anderson Stefan Lee Jesse Thomason LM&Ro 40 18 0 06 Oct 2022
MemoNav: Selecting Informative Memories for Visual Navigation Hongxin Li Xueke Yang Yu-Ren Yang Shuqi Mei Zhaoxiang Zhang 11 4 0 20 Aug 2022
Multimodal Learning with Transformers: A Survey P. Xu Xiatian Zhu David A. Clifton ViT 41 525 0 13 Jun 2022
POViT: Vision Transformer for Multi-objective Design and Characterization of Nanophotonic Devices Xinyu Chen Renjie Li Yueyao Yu Yuanwen Shen Wenye Li Zhaoyu Zhang Yin Zhang ViT 14 1 0 17 May 2022
Cross-modal Map Learning for Vision and Language Navigation G. Georgakis Karl Schmeckpeper Karan Wanchoo Soham Dan E. Miltsakaki Dan Roth Kostas Daniilidis 17 64 0 10 Mar 2022
Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language Navigation Shizhe Chen Pierre-Louis Guhur Makarand Tapaswi Cordelia Schmid Ivan Laptev LM&Ro 28 137 0 23 Feb 2022
Active Audio-Visual Separation of Dynamic Sound Sources Sagnik Majumder Kristen Grauman 19 21 0 02 Feb 2022
Language-Aligned Waypoint (LAW) Supervision for Vision-and-Language Navigation in Continuous Environments Sonia Raychaudhuri Saim Wani Shivansh Patel Unnat Jain Angel X. Chang LM&Ro 11 52 0 30 Sep 2021
Scaling Local Control to Large-Scale Topological Navigation Xiangyun Meng Nathan D. Ratliff Yu Xiang D. Fox 95 61 0 26 Sep 2019
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 246 496 0 07 Jun 2018