Towards Coarse-grained Visual Language Navigation Task Planning Enhanced
by Event Knowledge Graph

Towards Coarse-grained Visual Language Navigation Task Planning Enhanced by Event Knowledge Graph

5 August 2024

Zhao Kaichen

Song Yaoxian

Zhao Haiquan

Liu Haoyu

Li Tiefeng

Li Zhixu

Papers citing "Towards Coarse-grained Visual Language Navigation Task Planning Enhanced by Event Knowledge Graph"

5 / 5 papers shown

Title
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 265 4,229 0 30 Jan 2023
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action Dhruv Shah B. Osinski Brian Ichter Sergey Levine LM&Ro 139 436 0 10 Jul 2022
FILM: Following Instructions in Language with Modular Methods So Yeon Min Devendra Singh Chaplot Pradeep Ravikumar Yonatan Bisk Ruslan Salakhutdinov LM&Ro 204 159 0 12 Oct 2021
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 410 595 0 21 Jul 2020
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 246 496 0 07 Jun 2018