Self-Monitoring Navigation Agent via Auxiliary Progress Estimation

10 January 2019

Zuxuan Wu

ArXiv (abs)PDF HTML Github (122★)

Papers citing "Self-Monitoring Navigation Agent via Auxiliary Progress Estimation"

50 / 202 papers shown

MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots

125

22 Nov 2025

TP-MDDN: Task-Preferenced Multi-Demand-Driven Navigation with Autonomous Decision-Making

238

21 Nov 2025

STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization

150

27 Oct 2025

Embodied Navigation with Auxiliary Task of Action Description Prediction

Haru Kondoh

Asako Kanezaki

148

21 Oct 2025

NavQ: Learning a Q-Model for Foresighted Vision-and-Language Navigation

Peiran Xu

Xicheng Gong

Yadong Mu

141

18 Oct 2025

AdaNav: Adaptive Reasoning with Uncertainty for Vision-Language Navigation

...

168

29 Sep 2025

DAgger Diffusion Navigation: DAgger Boosted Diffusion Policy for Vision-Language Navigation

13 Aug 2025

Real-Time Progress Prediction in Reasoning Language Models

Hans Peter Lynsgøe Raaschou-jensen

Constanza Fierro

Anders Søgaard

LRM

217

29 Jun 2025

Weakly-supervised VLM-guided Partial Contrastive Learning for Visual Language Navigation

208

18 Jun 2025

Generating Vision-Language Navigation Instructions Incorporated Fine-Grained Alignment Annotations

175

10 Jun 2025

Cross from Left to Right Brain: Adaptive Text Dreamer for Vision-and-Language Navigation

396

27 May 2025

FlightGPT: Towards Generalizable and Interpretable UAV Vision-and-Language Navigation with Vision-Language Models

255

19 May 2025

Multimodal Fusion and Vision-Language Models: A Survey for Robot VisionInformation Fusion (Inf. Fusion), 2025

...

439

03 Apr 2025

Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation

488

23 Mar 2025

HA-VLN 2.0: An Open Benchmark and Leaderboard for Human-Aware Navigation in Discrete and Continuous Environments with Dynamic Multi-Human Interactions

...

Alexander G. Hauptmann

LM&Ro

295

18 Mar 2025

PanoGen++: Domain-Adapted Text-Guided Panoramic Environment Generation for Vision-and-Language NavigationNeural Networks (NN), 2025

330

13 Mar 2025

Ground-level Viewpoint Vision-and-Language Navigation in Continuous EnvironmentsIEEE International Conference on Robotics and Automation (ICRA), 2025

302

26 Feb 2025

OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation

...

487

25 Feb 2025

Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models

382

31 Dec 2024

Guide-LLM: An Embodied LLM Agent and Text-Based Topological Map for Robotic Guidance of People with Visual Impairments

Karthick Thiyagarajan

Jodi Martin

LM&Ro

378

28 Oct 2024

Vision-Language Navigation with Energy-Based PolicyNeural Information Processing Systems (NeurIPS), 2024

Rui Liu

Wenguan Wang

Yue Yang

229

18 Oct 2024

SYNERGAI: Perception Alignment for Human-Robot CollaborationIEEE International Conference on Robotics and Automation (ICRA), 2024

Yixin Chen

Guoxi Zhang

Yaowei Zhang

Hongming Xu

Peiyuan Zhi

Qing Li

Siyuan Huang

190

24 Sep 2024

StratXplore: Strategic Novelty-seeking and Instruction-aligned Exploration for Vision and Language NavigationIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2024

Muraleekrishna Gopinathan

Jumana Abu-Khalaf

David Suter

Martin Masek

223

09 Sep 2024

UNMuTe: Unifying Navigation and Multimodal Dialogue-like Text Generation

265

08 Aug 2024

NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models

Qi Wu

312

17 Jul 2024

PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation

Renjie Lu

Jingke Meng

Wei-Shi Zheng

222

16 Jul 2024

Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation

380

08 Jul 2024

Human-Aware Vision-and-Language Navigation: Bridging Simulation to Reality with Dynamic Human Interactions

Zhi-Qi Cheng

Alexander G. Hauptmann

LM&Ro

268

27 Jun 2024

Augmented Commonsense Knowledge for Remote Object Grounding

Qi Wu

220

03 Jun 2024

Correctable Landmark Discovery via Large Models for Vision-Language Navigation

Hang Xu

Xiaodan Liang

311

29 May 2024

Vision-and-Language Navigation Generative Pretrained Transformer

Hanlin Wen

LM&Ro

258

27 May 2024

MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains

311

17 May 2024

AIGeN: An Adversarial Approach for Instruction Generation in VLN

Lorenzo Baraldi

207

15 Apr 2024

DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive LearningInternational Conference on Language Resources and Evaluation (LREC), 2024

Xuanjing Huang

169

02 Apr 2024

Scaling Vision-and-Language Navigation With Offline RL

Biplab Banerjee

183

27 Mar 2024

Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation

303

23 Mar 2024

Continual Vision-and-Language Navigation

429

22 Mar 2024

Hierarchical Spatial Proximity Reasoning for Vision-and-Language NavigationIEEE Robotics and Automation Letters (RA-L), 2024

Ming Xu

Zilong Xie

287

18 Mar 2024

Online Continual Learning For Interactive Instruction Following AgentsInternational Conference on Learning Representations (ICLR), 2024

318

12 Mar 2024

NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled ReasoningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

Jianhua Han

Hang Xu

Xiaojun Chang

Xiaodan Liang

LM&Ro LRM

368

12 Mar 2024

Towards Deviation-Robust Agent Navigation via Perturbation-Aware Contrastive LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiaodan Liang

234

09 Mar 2024

NaVid: Video-based VLM Plans the Next Step for Vision-and-Language Navigation

Qi Wu

657

154

24 Feb 2024

Vision-Language Navigation with Embodied Intelligence: A Survey

357

22 Feb 2024

NavHint: Vision and Language Navigation Agent with a Hint Generator

Yue Zhang

Quan Guo

Parisa Kordjamshidi

LLMAG

287

04 Feb 2024

MapGPT: Map-Guided Prompting with Adaptive Path Planning for Vision-and-Language NavigationAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Xiaodan Liang

271

14 Jan 2024

Fast-Slow Test-Time Adaptation for Online Vision-and-Language NavigationInternational Conference on Machine Learning (ICML), 2023

563

22 Nov 2023

LangNav: Language as a Perceptual Representation for Navigation

309

11 Oct 2023

Grounded Entity-Landmark Adaptive Pre-training for Vision-and-Language NavigationIEEE International Conference on Computer Vision (ICCV), 2023

223

24 Aug 2023

VLN-PETL: Parameter-Efficient Transfer Learning for Vision-and-Language NavigationIEEE International Conference on Computer Vision (ICCV), 2023

Yanyuan Qiao

Zheng Yu

Qi Wu

VLM

179

20 Aug 2023

March in Chat: Interactive Prompting for Remote Embodied Referring ExpressionIEEE International Conference on Computer Vision (ICCV), 2023

Qi Wu

274

20 Aug 2023