TD-MPC2: Scalable, Robust World Models for Continuous Control

25 October 2023

Papers citing "TD-MPC2: Scalable, Robust World Models for Continuous Control"

37 / 37 papers shown

Title
Motion Control of High-Dimensional Musculoskeletal Systems with Hierarchical Model-Based Planning Yunyue Wei Shanning Zhuang Vincent Zhuang Yanan Sui 19 0 0 13 May 2025
Modeling Unseen Environments with Language-guided Composable Causal Components in Reinforcement Learning Xinyue Wang Biwei Huang OffRL CML 14 0 0 13 May 2025
CLAM: Continuous Latent Action Models for Robot Learning from Unlabeled Demonstrations Anthony Liang Pavel Czempin Matthew Hong Yutai Zhou Erdem Biyik Stephen Tu 45 0 0 08 May 2025
Merging and Disentangling Views in Visual Reinforcement Learning for Robotic Manipulation Abdulaziz Almuzairee Rohan Patil Dwait Bhatt Henrik I. Christensen 27 0 0 07 May 2025
Coupled Distributional Random Expert Distillation for World Model Online Imitation Learning Shangzhe Li Zhiao Huang Hao Su 55 0 0 04 May 2025
Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation Pascal Roth Jonas Frey César Cadena Marco Hutter 28 0 0 27 Apr 2025
RoboVerse: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning Haoran Geng Feishi Wang Songlin Wei Y. Li Bangjun Wang ... Hao Dong Siyuan Huang Yue Wang Jitendra Malik Pieter Abbeel 75 3 0 26 Apr 2025
Action Flow Matching for Continual Robot Learning Alejandro Murillo-Gonzalez Lantao Liu CLL 35 0 0 25 Apr 2025
PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation Wenxuan Li Hang Zhao Zhiyuan Yu Yu Du Qin Zou Ruizhen Hu K. Xu SSL 71 1 0 23 Apr 2025
Trust-Region Twisted Policy Improvement Joery A. de Vries Jinke He Yaniv Oren M. Spaan OffRL LRM 30 0 0 08 Apr 2025
AdaWorld: Learning Adaptable World Models with Latent Actions Shenyuan Gao Siyuan Zhou Yilun Du Jun Zhang Chuang Gan VGen 54 3 0 24 Mar 2025
Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach Steeven Janny Hervé Poirier L. Antsfeld G. Bono G. Monaci Boris Chidlovskii Francesco Giuliari Alessio Del Bue Christian Wolf LM&Ro 50 0 0 11 Mar 2025
Multi-Task Reinforcement Learning Enables Parameter Scaling Reginald McLean Evangelos Chataroulas Jordan Terry Isaac Woungang Nariman Farsad P. S. Castro LRM 39 0 0 07 Mar 2025
Hyperspherical Normalization for Scalable Deep Reinforcement Learning Hojoon Lee Youngdo Lee Takuma Seno Donghu Kim Peter Stone Jaegul Choo 63 1 0 24 Feb 2025
DMWM: Dual-Mind World Model with Long-Term Imagination Lingyi Wang Rashed Shelim Walid Saad Naren Ramakrishnan LRM 94 1 0 11 Feb 2025
Rapidly Adapting Policies to the Real World via Simulation-Guided Fine-Tuning Patrick Yin Tyler Westenbroek Simran Bagaria Kevin Huang Ching-an Cheng Andrey Kobolov Abhishek Gupta 70 2 0 04 Feb 2025
Navigation World Models Amir Bar G. Zhou Danny Tran Trevor Darrell Yann LeCun VGen EgoV 80 14 0 04 Dec 2024
Reward-free World Models for Online Imitation Learning Shangzhe Li Zhiao Huang H. Su OffRL 63 1 0 17 Oct 2024
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
Zero-Shot Offline Imitation Learning via Optimal Transport Thomas Rupf Marco Bagatella Nico Gürtler Jonas Frey Georg Martius OffRL 77 0 0 11 Oct 2024
Zero-Shot Generalization of Vision-Based RL Without Data Augmentation S. Batra Gaurav Sukhatme OffRL DRL 26 1 0 09 Oct 2024
Efficient Model-Based Reinforcement Learning Through Optimistic Thompson Sampling Jasmine Bayrooti Carl Henrik Ek Amanda Prorok 37 0 0 07 Oct 2024
Open-World Reinforcement Learning over Long Short-Term Imagination Jiajian Li Q. Wang Yunbo Wang Xin Jin Yang Li Wenjun Zeng Xiaokang Yang OCL VLM 47 1 0 04 Oct 2024
Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng Ruixi Qiao Gang Xiong Binhua Li Yingwei Ma Binhua Li Yongbin Li Yisheng Lv OffRL OnRL LM&Ro 35 3 0 01 Oct 2024
PIP-Loco: A Proprioceptive Infinite Horizon Planning Framework for Quadrupedal Robot Locomotion Aditya Shirwatkar Naman Saxena Kishore Chandra Shishir N Y Kolathaya 38 3 0 14 Sep 2024
MuJoCo MPC for Humanoid Control: Evaluation on HumanoidBench Moritz Meser Aditya Bhatt Boris Belousov Jan Peters 16 2 0 01 Aug 2024
Residual-MPPI: Online Policy Customization for Continuous Control Pengcheng Wang Chenran Li Catherine Weaver Kenta Kawamoto M. Tomizuka Chen Tang Wei Zhan OffRL 29 3 0 01 Jul 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 38 1 0 15 Jun 2024
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? Denis Tarasov Kirill Brilliantov Dmitrii Kharlapenko OffRL 30 2 0 10 Jun 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 37 16 0 25 May 2024
iVideoGPT: Interactive VideoGPTs are Scalable World Models Jialong Wu Shaofeng Yin Ningya Feng Xu He Dong Li Jianye Hao Mingsheng Long VGen 35 23 0 24 May 2024
Actor-Critic Model Predictive Control Angel Romero Yunlong Song Davide Scaramuzza 33 35 0 16 Jun 2023
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning Mitsuhiko Nakamoto Yuexiang Zhai Anika Singh Max Sobol Mark Yi-An Ma Chelsea Finn Aviral Kumar Sergey Levine OffRL OnRL 109 108 0 09 Mar 2023
EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-choice Dynamics Model Yifu Yuan Jianye Hao Fei Ni Yao Mu Yan Zheng Yujing Hu Jinyi Liu Yingfeng Chen Changjie Fan 71 12 0 02 Oct 2022
Task-Agnostic Learning to Accomplish New Tasks Xianqi Zhang Xingtao Wang Xu Liu Wenrui Wang Xiaopeng Fan Debin Zhao OffRL 80 0 0 09 Sep 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 303 11,881 0 04 Mar 2022
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 258 7,412 0 11 Nov 2021