MOPO: Model-based Offline Policy Optimization

27 May 2020

Papers citing "MOPO: Model-based Offline Policy Optimization"

50 / 183 papers shown

Title
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism Zihao Li Zhuoran Yang Mengdi Wang OffRL 31 54 0 29 May 2023
TOM: Learning Policy-Aware Models for Model-Based Reinforcement Learning via Transition Occupancy Matching Yecheng Jason Ma K. Sivakumar Jason Yan Osbert Bastani Dinesh Jayaraman OffRL MU 26 5 0 22 May 2023
Double Pessimism is Provably Efficient for Distributionally Robust Offline Reinforcement Learning: Generic Algorithm and Robust Partial Coverage Jose H. Blanchet Miao Lu Tong Zhang Han Zhong OffRL 45 29 0 16 May 2023
Prompt-Tuning Decision Transformer with Preference Ranking Shengchao Hu Li Shen Ya-Qin Zhang Dacheng Tao OffRL 30 14 0 16 May 2023
Get Back Here: Robust Imitation by Return-to-Distribution Planning Geoffrey Cideron B. Tabanpour Sebastian Curi Sertan Girgin Léonard Hussenot Gabriel Dulac-Arnold M. Geist Olivier Pietquin Robert Dadashi OOD 84 2 0 02 May 2023
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations Anqi Li Byron Boots Ching-An Cheng OffRL 28 16 0 30 Mar 2023
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning Han Zheng Xufang Luo Pengfei Wei Xuan Song Dongsheng Li Jing Jiang OffRL OnRL 18 21 0 14 Mar 2023
Beware of Instantaneous Dependence in Reinforcement Learning Zhengmao Zhu Yu-Ren Liu Hong Tian Yang Yu Anton van den Hengel OffRL 36 1 0 09 Mar 2023
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning Pengqin Wang Meixin Zhu Shaojie Shen OffRL 30 1 0 07 Mar 2023
Graph Decision Transformer Shengchao Hu Li Shen Ya-Qin Zhang Dacheng Tao OffRL 33 15 0 07 Mar 2023
Hindsight States: Blending Sim and Real Task Elements for Efficient Reinforcement Learning Simon Guist Jan Schneider-Barnes Alexander Dittrich V. Berenz Bernhard Schölkopf Le Chen 26 3 0 03 Mar 2023
Guarded Policy Optimization with Imperfect Online Demonstrations Zhenghai Xue Zhenghao Peng Quanyi Li Zhihan Liu Bolei Zhou OffRL 51 10 0 03 Mar 2023
Learning to Control Autonomous Fleets from Observation via Offline Reinforcement Learning Carolin Schmidt Daniele Gammelli Francisco Câmara Pereira Filipe Rodrigues OffRL 14 4 0 28 Feb 2023
VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function Approximation Thanh Nguyen-Tang R. Arora OffRL 46 5 0 24 Feb 2023
Neural Laplace Control for Continuous-time Delayed Systems Samuel Holt Alihan Huyuk Zhaozhi Qian Hao Sun M. Schaar OffRL 26 10 0 24 Feb 2023
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning Siliang Zeng Chenliang Li Alfredo García Min-Fong Hong OffRL 34 13 0 15 Feb 2023
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning Sheng Yue Guan-Bo Wang Wei Shao Zhaofeng Zhang Sen Lin Junkai Ren Junshan Zhang OffRL 31 20 0 09 Feb 2023
Offline Minimax Soft-Q-learning Under Realizability and Partial Coverage Masatoshi Uehara Nathan Kallus Jason D. Lee Wen Sun OffRL 47 5 0 05 Feb 2023
AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners Zhixuan Liang Yao Mu Mingyu Ding Fei Ni Masayoshi Tomizuka Ping Luo 80 99 0 03 Feb 2023
Anti-Exploration by Random Network Distillation Alexander Nikulin Vladislav Kurenkov Denis Tarasov Sergey Kolesnikov 38 24 0 31 Jan 2023
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu Paria Rashidinejad Jiantao Jiao OffRL 38 15 0 30 Jan 2023
Variational Latent Branching Model for Off-Policy Evaluation Qitong Gao Ge Gao Min Chi Miroslav Pajic OffRL 36 6 0 28 Jan 2023
On Pathologies in KL-Regularized Reinforcement Learning from Expert Demonstrations Tim G. J. Rudner Cong Lu Michael A. Osborne Yarin Gal Yee Whye Teh OffRL 27 27 0 28 Dec 2022
Faithful Heteroscedastic Regression with Neural Networks Andrew Stirn H. Wessels Megan D. Schertzer L. Pereira Neville E. Sanjana David A. Knowles UQCV 25 14 0 18 Dec 2022
Effects of Spectral Normalization in Multi-agent Reinforcement Learning K. Mehta Anuj Mahajan Kiran Ravish 24 7 0 10 Dec 2022
Behavior Estimation from Multi-Source Data for Offline Reinforcement Learning Guoxi Zhang H. Kashima OffRL 29 2 0 29 Nov 2022
Domain Generalization for Robust Model-Based Offline Reinforcement Learning Alan Clark Shoaib Ahmed Siddiqui Robert Kirk Usman Anwar Stephen Chung David M. Krueger OOD OffRL 27 0 0 27 Nov 2022
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning Charles A. Hepburn Giovanni Montana OffRL 29 13 0 21 Nov 2022
Contextual Transformer for Offline Meta Reinforcement Learning Runji Lin Ye Li Xidong Feng Zhaowei Zhang Xian Hong Wu Fung Haifeng Zhang Jun Wang Yali Du Yaodong Yang OffRL 20 6 0 15 Nov 2022
Offline Estimation of Controlled Markov Chains: Minimaxity and Sample Complexity Imon Banerjee Harsha Honnappa Vinayak A. Rao OffRL 11 0 0 14 Nov 2022
Wall Street Tree Search: Risk-Aware Planning for Offline Reinforcement Learning D. Elbaz Gal Novik Oren Salzman OffRL 27 0 0 06 Nov 2022
Contrastive Value Learning: Implicit Models for Simple Offline RL Bogdan Mazoure Benjamin Eysenbach Ofir Nachum Jonathan Tompson SSL OffRL 38 7 0 03 Nov 2022
Adaptive Behavior Cloning Regularization for Stable Offline-to-Online Reinforcement Learning Yi Zhao Rinu Boney Alexander Ilin Arno Solin Joni Pajarinen OffRL OnRL 26 39 0 25 Oct 2022
Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu Jack Parker-Holder Aldo Pacchiano Philip J. Ball Oleh Rybkin Stephen J. Roberts Tim Rocktaschel Edward Grefenstette OffRL 55 8 0 23 Oct 2022
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning Henrique Donancio L. Vercouter H. Roclawski AI4CE 18 1 0 20 Oct 2022
Causal Inference for De-biasing Motion Estimation from Robotic Observational Data Junhong Xu Kai-Li Yin Jason M. Gregory Lantao Liu CML 21 3 0 17 Oct 2022
When to Update Your Model: Constrained Model-based Reinforcement Learning Tianying Ji Yu-Juan Luo Gang Hua Mingxuan Jing Fengxiang He Wen-bing Huang 24 18 0 15 Oct 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 26 61 0 15 Oct 2022
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning Daesol Cho D. Shim H. J. Kim OffRL 42 11 0 30 Sep 2022
Latent Plans for Task-Agnostic Offline Reinforcement Learning Erick Rosete-Beas Oier Mees Gabriel Kalweit Joschka Boedecker Wolfram Burgard OffRL 30 81 0 19 Sep 2022
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation Xiaoteng Ma Zhipeng Liang Jose H. Blanchet MingWen Liu Li Xia Jiheng Zhang Qianchuan Zhao Zhengyuan Zhou OOD OffRL 41 22 0 14 Sep 2022
Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments Mengxin Yu Zhuoran Yang Jianqing Fan OffRL 21 8 0 23 Aug 2022
Efficient Planning in a Compact Latent Action Space Zhengyao Jiang Tianjun Zhang Michael Janner Yueying Li Tim Rocktaschel Edward Grefenstette Yuandong Tian OffRL 24 36 0 22 Aug 2022
Addressing Optimism Bias in Sequence Modeling for Reinforcement Learning Adam R. Villaflor Zheng Huang Swapnil Pande John M. Dolan J. Schneider OffRL 25 23 0 21 Jul 2022
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations Haoran Xu Xianyuan Zhan Honglei Yin Huiling Qin OffRL 26 66 0 20 Jul 2022
Offline Equilibrium Finding Shuxin Li Xinrun Wang Youzhi Zhang Jakub Cerny Pengdeng Li Hau Chan Bo An OffRL 43 2 0 12 Jul 2022
Offline Policy Optimization with Eligible Actions Yao Liu Yannis Flet-Berliac Emma Brunskill OffRL 25 5 0 01 Jul 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 50 101 0 19 Jun 2022
SMPL: Simulated Industrial Manufacturing and Process Control Learning Environments Mohan Zhang Xiaozhou Wang Benjamin Decardi-Nelson Bo Song A. Zhang ... Jiayi Cheng Xiaohong Liu DengDeng Yu Matthew Poon Animesh Garg 13 4 0 17 Jun 2022
Bootstrapped Transformer for Offline Reinforcement Learning Kerong Wang Hanye Zhao Xufang Luo Kan Ren Weinan Zhang Dongsheng Li OffRL 16 37 0 17 Jun 2022