DELAN: Dual-Level Alignment for Vision-and-Language Navigation by
Cross-Modal Contrastive Learning

DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning

2 April 2024

Xuanjing Huang

Papers citing "DELAN: Dual-Level Alignment for Vision-and-Language Navigation by Cross-Modal Contrastive Learning"

6 / 6 papers shown

Title
To Ask or Not to Ask? Detecting Absence of Information in Vision and Language Navigation Savitha Sam Abraham Sourav Garg Feras Dayoub 48 0 0 06 Nov 2024
EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language Models Mengfei Du Binhao Wu Zejun Li Xuanjing Huang Zhongyu Wei 31 9 0 09 Jun 2024
On Uni-Modal Feature Learning in Supervised Multi-Modal Learning Chenzhuang Du Jiaye Teng Tingle Li Yichen Liu Tianyuan Yuan Yue Wang Yang Yuan Hang Zhao 60 38 0 02 May 2023
LOViS: Learning Orientation and Visual Signals for Vision and Language Navigation Yue Zhang Parisa Kordjamshidi 26 11 0 26 Sep 2022
Language and Visual Entity Relationship Graph for Agent Navigation Yicong Hong Cristian Rodriguez-Opazo Yuankai Qi Qi Wu Stephen Gould LM&Ro 171 131 0 19 Oct 2020
Speaker-Follower Models for Vision-and-Language Navigation Daniel Fried Ronghang Hu Volkan Cirik Anna Rohrbach Jacob Andreas Louis-Philippe Morency Taylor Berg-Kirkpatrick Kate Saenko Dan Klein Trevor Darrell LM&Ro LRM 246 495 0 07 Jun 2018