Zero-Shot Robotic Manipulation with Pretrained Image-Editing Diffusion Models

16 October 2023

Papers citing "Zero-Shot Robotic Manipulation with Pretrained Image-Editing Diffusion Models"

49 / 99 papers shown

Title
Helpful DoggyBot: Open-World Object Fetching using Legged Robots and Vision-Language Models Qi Wu Zipeng Fu Xuxin Cheng Xiaolong Wang Chelsea Finn LM&Ro 26 8 0 30 Sep 2024
GravMAD: Grounded Spatial Value Maps Guided Action Diffusion for Generalized 3D Manipulation Yangtao Chen Zixuan Chen Junhui Yin Jing Huo Pinzhuo Tian Jieqi Shi Yang Gao LM&Ro 42 2 0 30 Sep 2024
FoAM: Foresight-Augmented Multi-Task Imitation Policy for Robotic Manipulation Litao Liu Wentao Wang Yifan Han Zhuoli Xie Pengfei Yi Junyan Li Yi Qin Wenzhao Lian 32 2 0 29 Sep 2024
Gen2Act: Human Video Generation in Novel Scenarios enables Generalizable Robot Manipulation Homanga Bharadhwaj Debidatta Dwibedi Abhinav Gupta Shubham Tulsiani Carl Doersch Ted Xiao Dhruv Shah Fei Xia Dorsa Sadigh Sean Kirmani VGen LM&Ro 35 27 0 24 Sep 2024
TinyVLA: Towards Fast, Data-Efficient Vision-Language-Action Models for Robotic Manipulation Junjie Wen Y. X. Zhu Jinming Li Minjie Zhu Kun Wu ... Ran Cheng Chaomin Shen Yaxin Peng Feifei Feng Jian Tang LM&Ro 56 41 0 19 Sep 2024
TacDiffusion: Force-domain Diffusion Policy for Precise Tactile Manipulation Yansong Wu Zongxie Chen Fan Wu L. Chen Liding Zhang Zhenshan Bing Abdalla Swikir Sami Haddadin Sami Haddadin 57 7 0 17 Sep 2024
Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion Models Rohit Jena Ali Taghibakhshi Sahil Jain Gerald Shen Nima Tajbakhsh Arash Vahdat 33 3 0 09 Sep 2024
Semantically Controllable Augmentations for Generalizable Robot Learning Zoey Chen Zhao Mandi Homanga Bharadhwaj Mohit Sharma Shuran Song Abhishek Gupta Vikash Kumar LM&Ro 29 5 0 02 Sep 2024
GR-MG: Leveraging Partially Annotated Data via Multi-Modal Goal Conditioned Policy Peiyan Li Hongtao Wu Yan Huang Chilam Cheang Liang Wang Tao Kong VGen 49 11 0 26 Aug 2024
Egocentric Vision Language Planning Zhirui Fang Ming Yang Weishuai Zeng Boyu Li Junpeng Yue Ziluo Ding Xiu Li Zongqing Lu LM&Ro 31 1 0 11 Aug 2024
Stimulating Imagination: Towards General-purpose Object Rearrangement Jianyang Wu Jie Gu Xiaokang Ma Chu Tang Jingmin Chen DiffM LM&Ro OCL 29 0 0 03 Aug 2024
Autonomous Improvement of Instruction Following Skills via Foundation Models Zhiyuan Zhou P. Atreya Abraham Lee Homer Walke Oier Mees Sergey Levine 30 8 0 30 Jul 2024
Robotic Control via Embodied Chain-of-Thought Reasoning Michał Zawalski William Chen Karl Pertsch Oier Mees Chelsea Finn Sergey Levine LRM LM&Ro 32 52 0 11 Jul 2024
Generative Image as Action Models Mohit Shridhar Yat Long Lo Stephen James 38 6 0 10 Jul 2024
RAM: Retrieval-Based Affordance Transfer for Generalizable Zero-Shot Robotic Manipulation Yuxuan Kuang Junjie Ye Haoran Geng Jiageng Mao Congyue Deng Leonidas J. Guibas He Wang Yue Wang LM&Ro 38 20 0 05 Jul 2024
Learning Action and Reasoning-Centric Image Editing from Videos and Simulations Benno Krojer Dheeraj Vattikonda Luis Lara Varun Jampani Eva Portelance Christopher Pal Siva Reddy EGVM VGen 40 3 0 03 Jul 2024
RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton Fanfan Liu Feng Yan Liming Zheng Chengjian Feng Yiyang Huang Lin Ma LM&Ro 21 11 0 27 Jun 2024
Dreamitate: Real-World Visuomotor Policy Learning via Video Generation Junbang Liang Ruoshi Liu Ege Ozguroglu Sruthi Sudhakar Achal Dave P. Tokmakov Shuran Song Carl Vondrick VGen 40 22 0 24 Jun 2024
Learning Temporal Distances: Contrastive Successor Features Can Provide a Metric Structure for Decision-Making Vivek Myers Chongyi Zheng Anca Dragan Sergey Levine Benjamin Eysenbach OffRL 36 7 0 24 Jun 2024
Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment Yiheng Li Heyang Jiang Akio Kodaira M. Tomizuka Kurt Keutzer Chenfeng Xu DiffM 29 7 0 18 Jun 2024
Language-Guided Manipulation with Diffusion Policies and Constrained Inpainting Ce Hao Kelvin Lin Siyuan Luo Harold Soh 28 4 0 14 Jun 2024
ATraDiff: Accelerating Online Reinforcement Learning with Imaginary Trajectories Qianlan Yang Yu-Xiong Wang OnRL 16 1 0 06 Jun 2024
Instruction-Guided Visual Masking Jinliang Zheng Jianxiong Li Si Cheng Yinan Zheng Jiaming Li Jihao Liu Yu Liu Jingjing Liu Xianyuan Zhan 26 5 0 30 May 2024
Render and Diffuse: Aligning Image and Action Spaces for Diffusion-based Behaviour Cloning Vitalis Vosylius Younggyo Seo Jafar Uruç Stephen James 24 12 0 28 May 2024
Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Shenyuan Gao Jiazhi Yang Li Chen Kashyap Chitta Yihang Qiu Andreas Geiger Jun Zhang Hongyang Li 60 75 0 27 May 2024
A Survey of Robotic Language Grounding: Tradeoffs between Symbols and Embeddings Vanya Cohen J. Liu Raymond J. Mooney Stefanie Tellex David Watkins LM&Ro 26 12 0 21 May 2024
Octo: An Open-Source Generalist Robot Policy Octo Model Team Dibya Ghosh Homer Walke Karl Pertsch Kevin Black ... Quan Vuong Ted Xiao Dorsa Sadigh Chelsea Finn Sergey Levine 55 333 0 20 May 2024
DiffuseLoco: Real-Time Legged Locomotion Control with Diffusion from Offline Datasets Xiaoyu Huang Yufeng Chi Ruofeng Wang Zhongyu Li Xue Bin Peng Sophia Shao Borivoje Nikolic K. Sreenath OffRL 54 23 0 30 Apr 2024
What Foundation Models can Bring for Robot Learning in Manipulation : A Survey Dingzhe Li Yixiang Jin A. Yong Hongze Yu Jun Shi Xiaoshuai Hao Peng Hao Huaping Liu Fuchun Sun Bin Fang AI4CE LM&Ro 64 12 0 28 Apr 2024
COMBO: Compositional World Models for Embodied Multi-Agent Cooperation Hongxin Zhang Zeyuan Wang Qiushi Lyu Zheyuan Zhang Sunli Chen Tianmin Shu Yilun Du Kwonjoon Lee Yilun Du Chuang Gan 41 12 0 16 Apr 2024
3D-VLA: A 3D Vision-Language-Action Generative World Model Haoyu Zhen Xiaowen Qiu Peihao Chen Jincheng Yang Xin Yan Yilun Du Yining Hong Chuang Gan LM&Ro VGen PINN 34 81 0 14 Mar 2024
Mirage: Cross-Embodiment Zero-Shot Policy Transfer with Cross-Painting L. Chen Kush Hari K. Dharmarajan Chenfeng Xu Quan Vuong Ken Goldberg 39 19 0 29 Feb 2024
DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning Jianxiong Li Jinliang Zheng Yinan Zheng Liyuan Mao Xiaoming Hu ... Jihao Liu Yu Liu Jingjing Liu Ya-Qin Zhang Xianyuan Zhan LM&Ro OffRL 29 8 0 28 Feb 2024
Diffusion Meets DAgger: Supercharging Eye-in-hand Imitation Learning Xiaoyu Zhang Matthew Chang Pranav Kumar Saurabh Gupta DiffM OffRL 43 13 0 27 Feb 2024
Video as the New Language for Real-World Decision Making Sherry Yang Jacob Walker Jack Parker-Holder Yilun Du Jake Bruce Andre Barreto Pieter Abbeel Dale Schuurmans VGen 21 45 0 27 Feb 2024
CyberDemo: Augmenting Simulated Human Demonstration for Real-World Dexterous Manipulation Jun Wang Yuzhe Qin Kaiming Kuang Yigit Korkmaz Akhilan Gurumoorthy Hao Su Xiaolong Wang 34 19 0 22 Feb 2024
3D Diffuser Actor: Policy Diffusion with 3D Scene Representations Tsung-Wei Ke N. Gkanatsios Katerina Fragkiadaki VGen 28 102 0 16 Feb 2024
Real-World Robot Applications of Foundation Models: A Review Kento Kawaharazuka T. Matsushima Andrew Gambardella Jiaxian Guo Chris Paxton Andy Zeng OffRL VLM LM&Ro 41 45 0 08 Feb 2024
Any-point Trajectory Modeling for Policy Learning Chuan Wen Xingyu Lin John So Kai-xiang Chen Qi Dou Yang Gao Pieter Abbeel PINN VGen 31 79 0 28 Dec 2023
Explicit-Implicit Subgoal Planning for Long-Horizon Tasks with Sparse Reward Fangyuan Wang Anqing Duan Peng Zhou Shengzeng Huo Guodong Guo Chenguang Yang D. Navarro-Alarcon OffRL VLM 17 0 0 25 Dec 2023
Toward General-Purpose Robots via Foundation Models: A Survey and Meta-Analysis Yafei Hu Quanting Xie Vidhi Jain Jonathan M Francis Jay Patrikar ... Xiaolong Wang Sebastian A. Scherer Z. Kira Fei Xia Yonatan Bisk LM&Ro AI4CE 30 62 0 14 Dec 2023
Diffusion Models for Reinforcement Learning: A Survey Zhengbang Zhu Hanye Zhao Haoran He Yichao Zhong Shenyu Zhang Haoquan Guo Tingting Chen Weinan Zhang 27 58 0 02 Nov 2023
Challenges for Monocular 6D Object Pose Estimation in Robotics S. Thalhammer Dominik Bauer Peter Honig Jean-Baptiste Weibel José García-Rodríguez Markus Vincze 31 24 0 22 Jul 2023
Language-Conditioned Imitation Learning with Base Skill Priors under Unstructured Data Hongkuan Zhou Zhenshan Bing Xiangtong Yao Xiaojie Su Chenguang Yang Kai-Qi Huang Alois C. Knoll LM&Ro 26 18 0 30 May 2023
Open-World Object Manipulation using Pre-trained Vision-Language Models Austin Stone Ted Xiao Yao Lu K. Gopalakrishnan Kuang-Huei Lee ... Sean Kirmani Brianna Zitkovich F. Xia Chelsea Finn Karol Hausman LM&Ro 142 144 0 02 Mar 2023
DALL-E-Bot: Introducing Web-Scale Diffusion Models to Robotics Ivan Kapelyukh Vitalis Vosylius Edward Johns LM&Ro DiffM 99 143 0 05 Oct 2022
Planning with Diffusion for Flexible Behavior Synthesis Michael Janner Yilun Du J. Tenenbaum Sergey Levine DiffM 202 622 0 20 May 2022
Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman Andrew Westbury Eugene Byrne Zachary Chavis Antonino Furnari ... Mike Zheng Shou Antonio Torralba Lorenzo Torresani Mingfei Yan Jitendra Malik EgoV 224 1,017 0 13 Oct 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 197 412 0 16 Feb 2021