ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks

3 December 2019

Luke Zettlemoyer

Papers citing "ALFRED: A Benchmark for Interpreting Grounded Instructions for Everyday Tasks"

50 / 156 papers shown

Title
Interaction is all You Need? A Study of Robots Ability to Understand and Execute Kushal Koshti Nidhir Bhavsar 50 1 0 13 Nov 2023
ADaPT: As-Needed Decomposition and Planning with Language Models Archiki Prasad Alexander Koller Mareike Hartmann Peter Clark Ashish Sabharwal Mohit Bansal Tushar Khot LM&Ro 29 75 0 08 Nov 2023
Fully Automated Task Management for Generation, Execution, and Evaluation: A Framework for Fetch-and-Carry Tasks with Natural Language Instructions in Continuous Space Motonari Kambara K. Sugiura LM&Ro 24 0 0 07 Nov 2023
Advances in Embodied Navigation Using Large Language Models: A Survey Jinzhou Lin Han Gao Xuxiang Feng Rongtao Xu Changwei Wang Man Zhang Li Guo Shibiao Xu LM&Ro LLMAG 66 9 0 01 Nov 2023
DetermiNet: A Large-Scale Diagnostic Dataset for Complex Visually-Grounded Referencing using Determiners Clarence Lee M Ganesh Kumar Cheston Tan 28 3 0 07 Sep 2023
AerialVLN: Vision-and-Language Navigation for UAVs Shubo Liu Hongsheng Zhang Yuankai Qi Peifeng Wang Yaning Zhang Qi Wu CoGe 32 40 0 13 Aug 2023
MAEA: Multimodal Attribution for Embodied AI Vidhi Jain Jayant Sravan Tamarapalli Sahiti Yerramilli Yonatan Bisk 34 0 0 25 Jul 2023
Building Cooperative Embodied Agents Modularly with Large Language Models Hongxin Zhang Weihua Du Jiaming Shan Qinhong Zhou Yilun Du J. Tenenbaum Tianmin Shu Chuang Gan LLMAG LM&Ro 50 157 0 05 Jul 2023
SPRINT: Scalable Policy Pre-Training via Language Instruction Relabeling Jesse Zhang Karl Pertsch Jiahui Zhang Joseph J. Lim LM&Ro 36 17 0 20 Jun 2023
HomeRobot: Open-Vocabulary Mobile Manipulation Sriram Yenamandra A. Ramachandran Karmesh Yadav Austin S. Wang Mukul Khanna ... Devendra Singh Chaplot Dhruv Batra Roozbeh Mottaghi Yonatan Bisk Chris Paxton LM&Ro 39 79 0 20 Jun 2023
PanoGen: Text-Conditioned Panoramic Environment Generation for Vision-and-Language Navigation Jialu Li Mohit Bansal DiffM 27 49 0 30 May 2023
Multimodal Grounding for Embodied AI via Augmented Reality Headsets for Natural Language Driven Task Planning Selma Wanna Fabian Parra R. Valner Karl Kruusamäe Mitch Pryor LM&Ro 26 2 0 26 Apr 2023
LINGO : Visually Debiasing Natural Language Instructions to Support Task Diversity Anjana Arunkumar Shubham Sharma Rakhi Agrawal Sriramakrishnan Chandrasekaran Chris Bryan 26 0 0 12 Apr 2023
Improving Vision-and-Language Navigation by Generating Future-View Image Semantics Jialu Li Mohit Bansal 21 34 0 11 Apr 2023
Embodied Concept Learner: Self-supervised Learning of Concepts and Mapping through Instruction Following Mingyu Ding Yan Xu Zhenfang Chen David D. Cox Ping Luo J. Tenenbaum Chuang Gan LM&Ro 56 21 0 07 Apr 2023
Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark Alexander Pan Chan Jun Shern Andy Zou Nathaniel Li Steven Basart Thomas Woodside Jonathan Ng Hanlin Zhang Scott Emmons Dan Hendrycks 26 126 0 06 Apr 2023
Chain-of-Thought Predictive Control Zhiwei Jia Vineet Thumuluri Fangchen Liu Ling-Hao Chen Zhiao Huang H. Su LM&Ro 28 20 0 03 Apr 2023
LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention Renrui Zhang Jiaming Han Chris Liu Peng Gao Aojun Zhou Xiangfei Hu Shilin Yan Pan Lu Hongsheng Li Yu Qiao MLLM 35 739 0 28 Mar 2023
Interpretable Anomaly Detection via Discrete Optimization Simon Lutz Florian Wittbold Simon Dierl Benedikt Böing F. Howar Barbara König Emmanuel Müller Daniel Neider AAML 27 0 0 24 Mar 2023
SEAL: Semantic Frame Execution And Localization for Perceiving Afforded Robot Actions Cameron Kisailus Daksh Narang Matthew P Shannon Odest Chadwicke Jenkins 20 0 0 24 Mar 2023
CB2: Collaborative Natural Language Interaction Research Platform Jacob Sharf Mustafa Omer Gul Yoav Artzi LLMAG 35 1 0 14 Mar 2023
Naming Objects for Vision-and-Language Manipulation Tokuhiro Nishikawa Kazumi Aoyama Shunichi Sekiguchi Takayoshi Takayanagi Jianing Wu Yu Ishihara Tamaki Kojima Jerry Jun Yokono 32 1 0 06 Mar 2023
Task-Oriented Grasp Prediction with Visual-Language Inputs Chao Tang Dehao Huang Lingxiao Meng Weiyu Liu Hong Zhang 25 33 0 28 Feb 2023
Dynamic Storyboard Generation in an Engine-based Virtual Environment for Video Production Anyi Rao Xuekun Jiang Yuwei Guo Linning Xu Lei Yang Libiao Jin Dahua Lin Bo Dai VGen 23 15 0 30 Jan 2023
Do Embodied Agents Dream of Pixelated Sheep: Embodied Decision Making using Language Guided World Modelling Kolby Nottingham Prithviraj Ammanabrolu Alane Suhr Yejin Choi Hannaneh Hajishirzi Sameer Singh Roy Fox LLMAG LM&Ro 42 76 0 28 Jan 2023
A Data-Efficient Visual-Audio Representation with Intuitive Fine-tuning for Voice-Controlled Robots Peixin Chang Shuijing Liu Tianchen Ji Neeloy Chakraborty Kaiwen Hong Katherine Driggs-Campbell 43 3 0 23 Jan 2023
Diffusion-based Generation, Optimization, and Planning in 3D Scenes Siyuan Huang Zan Wang Puhao Li Baoxiong Jia Tengyu Liu Yixin Zhu Wei Liang Song-Chun Zhu DiffM 64 199 0 15 Jan 2023
Don't Generate, Discriminate: A Proposal for Grounding Language Models to Real-World Environments Yu Gu Xiang Deng Yu-Chuan Su LLMAG 31 52 0 19 Dec 2022
OpenD: A Benchmark for Language-Driven Door and Drawer Opening Yizhou Zhao Qiaozi Gao Liang Qiu Govind Thattai Gaurav Sukhatme 16 5 0 10 Dec 2022
Learning Action-Effect Dynamics from Pairs of Scene-graphs Shailaja Keyur Sampat Pratyay Banerjee Yezhou Yang Chitta Baral GNN 18 0 0 07 Dec 2022
A General Purpose Supervisory Signal for Embodied Agents Kunal Pratap Singh Jordi Salvador Luca Weihs Aniruddha Kembhavi SSL 21 3 0 01 Dec 2022
lilGym: Natural Language Visual Reasoning with Reinforcement Learning Anne Wu Kianté Brantley Noriyuki Kojima Yoav Artzi ReLM OffRL LRM 19 3 0 03 Nov 2022
50 Ways to Bake a Cookie: Mapping the Landscape of Procedural Texts Moran Mizrahi Dafna Shahaf DiffM 23 4 0 31 Oct 2022
Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object Transport S. Narayanan Dinesh Jayaraman Manmohan Chandraker 16 1 0 28 Oct 2022
DOROTHIE: Spoken Dialogue for Handling Unexpected Situations in Interactive Autonomous Driving Agents Ziqiao Ma B. VanDerPloeg Cristian-Paul Bara Yidong Huang Eui-In Kim Felix Gervits M. Marge J. Chai 52 7 0 22 Oct 2022
DANLI: Deliberative Agent for Following Natural Language Instructions Yichi Zhang Jianing Yang Jiayi Pan Shane Storks N. Devraj Ziqiao Ma Keunwoo Peter Yu Yuwei Bao J. Chai LM&Ro 50 16 0 22 Oct 2022
Commonsense Knowledge from Scene Graphs for Textual Environments Tsunehiko Tanaka Daiki Kimura Michiaki Tatsubori 18 2 0 19 Oct 2022
ULN: Towards Underspecified Vision-and-Language Navigation Weixi Feng Tsu-jui Fu Yujie Lu William Yang Wang 43 5 0 18 Oct 2022
VIMA: General Robot Manipulation with Multimodal Prompts Yunfan Jiang Agrim Gupta Zichen Zhang Guanzhi Wang Yongqiang Dou Yanjun Chen Li Fei-Fei Anima Anandkumar Yuke Zhu Linxi Fan LM&Ro 24 335 0 06 Oct 2022
Iterative Vision-and-Language Navigation Jacob Krantz Shurjo Banerjee Wang Zhu Jason J. Corso Peter Anderson Stefan Lee Jesse Thomason LM&Ro 40 18 0 06 Oct 2022
Zero-shot Active Visual Search (ZAVIS): Intelligent Object Search for Robotic Assistants Jeongeun Park Taerim Yoon Jejoon Hong Youngjae Yu Matthew K. X. J. Pan Sungjoon Choi 38 13 0 19 Sep 2022
On Grounded Planning for Embodied Tasks with Language Models Bill Yuchen Lin Chengsong Huang Qian Liu Wenda Gu Sam Sommerer Xiang Ren LM&Ro 28 39 0 29 Aug 2022
TextWorldExpress: Simulating Text Games at One Million Steps Per Second Peter Alexander Jansen Marc-Alexandre Côté VLM LRM 24 6 0 01 Aug 2022
Target-Driven Structured Transformer Planner for Vision-Language Navigation Yusheng Zhao Jinyu Chen Chen Gao Wenguan Wang Lirong Yang Haibing Ren Huaxia Xia Si Liu LM&Ro 21 57 0 19 Jul 2022
Reasoning about Actions over Visual and Linguistic Modalities: A Survey Shailaja Keyur Sampat Maitreya Patel Subhasish Das Yezhou Yang Chitta Baral ReLM LM&Ro LRM 19 12 0 15 Jul 2022
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action Dhruv Shah B. Osinski Brian Ichter Sergey Levine LM&Ro 147 436 0 10 Jul 2022
Finding Fallen Objects Via Asynchronous Audio-Visual Integration Chuang Gan Yi Gu Siyuan Zhou Jeremy Schwartz S. Alter James Traer Dan Gutfreund J. Tenenbaum Josh H. McDermott Antonio Torralba 40 19 0 07 Jul 2022
Good Time to Ask: A Learning Framework for Asking for Help in Embodied Visual Navigation Jenny Zhang Samson Yu Jiafei Duan Cheston Tan 31 3 0 20 Jun 2022
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge Linxi Fan Guanzhi Wang Yunfan Jiang Ajay Mandlekar Yuncong Yang Haoyi Zhu Andrew Tang De-An Huang Yuke Zhu Anima Anandkumar LM&Ro 42 348 0 17 Jun 2022
VLMbench: A Compositional Benchmark for Vision-and-Language Manipulation Kai Zheng Xiaotong Chen Odest Chadwicke Jenkins X. Wang LM&Ro CoGe 19 54 0 17 Jun 2022