Scene-Intuitive Agent for Remote Embodied Visual Grounding

Computer Vision and Pattern Recognition (CVPR), 2021

24 March 2021

Papers citing "Scene-Intuitive Agent for Remote Embodied Visual Grounding"

39 / 39 papers shown

TP-MDDN: Task-Preferenced Multi-Demand-Driven Navigation with Autonomous Decision-Making

316

21 Nov 2025

NavQ: Learning a Q-Model for Foresighted Vision-and-Language Navigation

Peiran Xu

Xicheng Gong

Yadong Mu

196

18 Oct 2025

Landmark-Guided Knowledge for Vision-and-Language NavigationInternational Conference on Intelligent Computing (ICIC), 2025

201

30 Sep 2025

Weakly-supervised VLM-guided Partial Contrastive Learning for Visual Language Navigation

288

18 Jun 2025

DOPE: Dual Object Perception-Enhancement Network for Vision-and-Language NavigationInternational Conference on Multimedia Retrieval (ICMR), 2025

Yinfeng Yu

Dongsheng Yang

442

30 Apr 2025

Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation

564

23 Mar 2025

PanoGen++: Domain-Adapted Text-Guided Panoramic Environment Generation for Vision-and-Language NavigationNeural Networks (NN), 2025

368

13 Mar 2025

Vision-and-Language Navigation Today and Tomorrow: A Survey in the Era of Foundation Models

442

31 Dec 2024

SAME: Learning Generic Language-Guided Visual Navigation with State-Adaptive Mixture of Experts

219

07 Dec 2024

Planning from Imagination: Episodic Simulation and Episodic Memory for Vision-and-Language NavigationAAAI Conference on Artificial Intelligence (AAAI), 2024

544

30 Nov 2024

Augmented Commonsense Knowledge for Remote Object Grounding

Qi Wu

253

03 Jun 2024

Correctable Landmark Discovery via Large Models for Vision-Language Navigation

Hang Xu

Xiaodan Liang

392

29 May 2024

Vision-and-Language Navigation Generative Pretrained Transformer

Hanlin Wen

LM&Ro

317

27 May 2024

Vision-and-Language Navigation via Causal Learning

334

16 Apr 2024

AIGeN: An Adversarial Approach for Instruction Generation in VLN

Lorenzo Baraldi

286

15 Apr 2024

Temporal-Spatial Object Relations Modeling for Vision-and-Language Navigation

373

23 Mar 2024

Volumetric Environment Representation for Vision-Language Navigation

Rui Liu

Wenguan Wang

Yi Yang

322

21 Mar 2024

Hierarchical Spatial Proximity Reasoning for Vision-and-Language NavigationIEEE Robotics and Automation Letters (RA-L), 2024

Ming Xu

Zilong Xie

323

18 Mar 2024

Causality-based Cross-Modal Representation Learning for Vision-and-Language Navigation

336

06 Mar 2024

Vision-Language Navigation with Embodied Intelligence: A Survey

498

22 Feb 2024

Fast-Slow Test-Time Adaptation for Online Vision-and-Language NavigationInternational Conference on Machine Learning (ICML), 2023

646

22 Nov 2023

Bird's-Eye-View Scene Graph for Vision-Language NavigationIEEE International Conference on Computer Vision (ICCV), 2023

392

100

09 Aug 2023

Scaling Data Generation in Vision-and-Language NavigationIEEE International Conference on Computer Vision (ICCV), 2023

Zun Wang

Jialu Li

Yicong Hong

Yi Wang

Qi Wu

Yu Qiao

426

134

28 Jul 2023

Learning Vision-and-Language Navigation from YouTube VideosIEEE International Conference on Computer Vision (ICCV), 2023

Chuang Gan

288

22 Jul 2023

GeoVLN: Learning Geometry-Enhanced Visual Representation with Slot Attention for Vision-and-Language NavigationComputer Vision and Pattern Recognition (CVPR), 2023

455

26 May 2023

A Dual Semantic-Aware Recurrent Global-Adaptive Network For Vision-and-Language NavigationInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

355

05 May 2023

Meta-Explore: Exploratory Hierarchical Vision-and-Language Navigation Using Scene Object Spectrum GroundingComputer Vision and Pattern Recognition (CVPR), 2023

291

07 Mar 2023

Actional Atomic-Concept Learning for Demystifying Vision-Language NavigationAAAI Conference on Artificial Intelligence (AAAI), 2023

Xiaodan Liang

377

13 Feb 2023

Multiple Thinking Achieving Meta-Ability Decoupling for Object NavigationInternational Conference on Machine Learning (ICML), 2023

193

03 Feb 2023

RREx-BoT: Remote Referring Expressions with a Bag of TricksIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

280

30 Jan 2023

BEVBert: Multimodal Map Pre-training for Language-guided Navigation

338

131

08 Dec 2022

Layout-aware Dreamer for Embodied Referring Expression Grounding

Mingxiao Li

Zehao Wang

Tinne Tuytelaars

Marie-Francine Moens

LM&Ro

197

30 Nov 2022

Embodied Referring Expression for Manipulation Question Answering in Interactive EnvironmentIEEE International Conference on Robotics and Automation (ICRA), 2022

Qie Sima

Sinan Tan

Huaping Liu

LM&Ro

221

06 Oct 2022

Learning from Unlabeled 3D Environments for Vision-and-Language NavigationEuropean Conference on Computer Vision (ECCV), 2022

387

24 Aug 2022

Target-Driven Structured Transformer Planner for Vision-Language NavigationACM Multimedia (ACM MM), 2022

482

19 Jul 2022

Vision-and-Language Navigation: A Survey of Tasks, Methods, and Future DirectionsAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Qi Wu

437

170

22 Mar 2022

Think Global, Act Local: Dual-scale Graph Transformer for Vision-and-Language NavigationComputer Vision and Pattern Recognition (CVPR), 2022

389

238

23 Feb 2022

History Aware Multimodal Transformer for Vision-and-Language Navigation

378

345

25 Oct 2021

Vision-Language Navigation: A Survey and Taxonomy

440

26 Aug 2021