Conservative Q-Learning for Offline Reinforcement Learning

8 June 2020

Papers citing "Conservative Q-Learning for Offline Reinforcement Learning"

42 / 392 papers shown

Title
ManiSkill: Generalizable Manipulation Skill Benchmark with Large-Scale Demonstrations Tongzhou Mu Z. Ling Fanbo Xiang Derek Yang Xuanlin Li Stone Tao Zhiao Huang Zhiwei Jia Hao Su 39 130 0 30 Jul 2021
Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings Shengpu Tang Jenna Wiens OffRL 26 78 0 23 Jul 2021
Constraints Penalized Q-learning for Safe Offline Reinforcement Learning Haoran Xu Xianyuan Zhan Xiangyu Zhu OffRL 16 85 0 19 Jul 2021
Visual Adversarial Imitation Learning using Variational Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn SSL 28 49 0 16 Jul 2021
Conservative Objective Models for Effective Offline Model-Based Optimization Brandon Trabucco Aviral Kumar Xinyang Geng Sergey Levine OffRL 42 86 0 14 Jul 2021
Conservative Offline Distributional Reinforcement Learning Yecheng Jason Ma Dinesh Jayaraman Osbert Bastani OffRL 70 78 0 12 Jul 2021
Offline reinforcement learning with uncertainty for treatment strategies in sepsis Ran Liu J. Greenstein J. Fackler Jules Bergmann M. Bembea R. Winslow OffRL 14 7 0 09 Jul 2021
Supervised Off-Policy Ranking Yue Jin Yue Zhang Tao Qin Xudong Zhang Jian Yuan Houqiang Li Tie-Yan Liu OffRL 32 5 0 03 Jul 2021
IQ-Learn: Inverse soft-Q Learning for Imitation Divyansh Garg Shuvam Chakraborty Chris Cundy Jiaming Song Matthieu Geist Stefano Ermon 51 178 0 23 Jun 2021
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Jongmin Lee Wonseok Jeon Byung-Jun Lee J. Pineau Kee-Eung Kim OffRL 37 90 0 21 Jun 2021
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL Catherine Cang Aravind Rajeswaran Pieter Abbeel Michael Laskin OffRL 21 29 0 16 Jun 2021
Offline RL Without Off-Policy Evaluation David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna OffRL 42 161 0 16 Jun 2021
Bellman-consistent Pessimism for Offline Reinforcement Learning Tengyang Xie Ching-An Cheng Nan Jiang Paul Mineiro Alekh Agarwal OffRL LRM 27 269 0 13 Jun 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 58 780 0 12 Jun 2021
Offline Reinforcement Learning as Anti-Exploration Shideh Rezaeifar Robert Dadashi Nino Vieillard Léonard Hussenot Olivier Bachem Olivier Pietquin M. Geist OffRL 34 51 0 11 Jun 2021
Heuristic-Guided Reinforcement Learning Ching-An Cheng Andrey Kolobov Adith Swaminathan OffRL 30 61 0 05 Jun 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 66 645 0 03 Jun 2021
Uncertainty Weighted Actor-Critic for Offline Reinforcement Learning Yue Wu Shuangfei Zhai Nitish Srivastava J. Susskind Jian Zhang Ruslan Salakhutdinov Hanlin Goh EDL OffRL OnRL 21 184 0 17 May 2021
Safe Chance Constrained Reinforcement Learning for Batch Process Control M. Mowbray Panagiotis Petsagkourakis Ehecatl Antonio del Rio Chanona Dongda Zhang OffRL 31 34 0 23 Apr 2021
Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills Yevgen Chebotar Karol Hausman Yao Lu Ted Xiao Dmitry Kalashnikov ... A. Irpan Benjamin Eysenbach Ryan Julian Chelsea Finn Sergey Levine SSL OffRL 32 146 0 15 Apr 2021
Nearly Horizon-Free Offline Reinforcement Learning Tongzheng Ren Jialian Li Bo Dai S. Du Sujay Sanghavi OffRL 26 49 0 25 Mar 2021
Robust Multi-Modal Policies for Industrial Assembly via Reinforcement Learning and Demonstrations: A Large-Scale Study Jianlan Luo Oleg O. Sushkov Rugile Pevceviciute Wenzhao Lian Chang Su Mel Vecerík Ning Ye S. Schaal Jonathan Scholz OffRL 27 60 0 21 Mar 2021
Regularized Behavior Value Estimation Çağlar Gülçehre Sergio Gomez Colmenarejo Ziyun Wang Jakub Sygnowski T. Paine Konrad Zolna Yutian Chen Matthew W. Hoffman Razvan Pascanu Nando de Freitas OffRL 28 37 0 17 Mar 2021
Offline Reinforcement Learning with Fisher Divergence Critic Regularization Ilya Kostrikov Jonathan Tompson Rob Fergus Ofir Nachum OffRL 29 300 0 14 Mar 2021
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning Samarth Sinha Ajay Mandlekar Animesh Garg OffRL 26 104 0 10 Mar 2021
Instabilities of Offline RL with Pre-Trained Neural Representation Ruosong Wang Yifan Wu Ruslan Salakhutdinov Sham Kakade OffRL 20 42 0 08 Mar 2021
Offline Reinforcement Learning with Pseudometric Learning Robert Dadashi Shideh Rezaeifar Nino Vieillard Léonard Hussenot Olivier Pietquin M. Geist OffRL 31 40 0 02 Mar 2021
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning Xianyuan Zhan Haoran Xu Yueying Zhang Xiangyu Zhu Honglei Yin Yu Zheng OffRL AI4CE 40 67 0 23 Feb 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 413 0 16 Feb 2021
PerSim: Data-Efficient Offline Reinforcement Learning with Heterogeneous Agents via Personalized Simulators Anish Agarwal Abdullah Alomar Varkey Alumootil Devavrat Shah Dennis Shen Zhi Xu Cindy Yang OffRL 18 18 0 13 Feb 2021
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning Rongjun Qin Songyi Gao Xingyuan Zhang Zhen Xu Shengkai Huang Zewen Li Weinan Zhang Yang Yu OffRL 137 6 0 01 Feb 2021
Evolving Reinforcement Learning Algorithms John D. Co-Reyes Yingjie Miao Daiyi Peng Esteban Real Sergey Levine Quoc V. Le Honglak Lee Aleksandra Faust 46 73 0 08 Jan 2021
Is Pessimism Provably Efficient for Offline RL? Ying Jin Zhuoran Yang Zhaoran Wang OffRL 27 346 0 30 Dec 2020
POPO: Pessimistic Offline Policy Optimization Qiang He Xinwen Hou OffRL 32 10 0 26 Dec 2020
Reliable Off-policy Evaluation for Reinforcement Learning Jie Wang Rui Gao H. Zha OffRL 22 11 0 08 Nov 2020
COG: Connecting New Skills to Past Experience with Offline Reinforcement Learning Avi Singh Albert Yu Jonathan Yang Jesse Zhang Aviral Kumar Sergey Levine SSL OffRL OnRL 35 103 0 27 Oct 2020
OPAL: Offline Primitive Discovery for Accelerating Offline Reinforcement Learning Anurag Ajay Aviral Kumar Pulkit Agrawal Sergey Levine Ofir Nachum OffRL OnRL 34 153 0 26 Oct 2020
DeepAveragers: Offline Reinforcement Learning by Solving Derived Non-Parametric MDPs Aayam Shrestha Stefan Lee Prasad Tadepalli Alan Fern OffRL 55 23 0 18 Oct 2020
The Importance of Pessimism in Fixed-Dataset Policy Optimization Jacob Buckman Carles Gelada Marc G. Bellemare OffRL 36 135 0 15 Sep 2020
Learning Off-Policy with Online Planning Harshit S. Sikchi Wenxuan Zhou David Held OffRL 37 45 0 23 Aug 2020
Acme: A Research Framework for Distributed Reinforcement Learning Matthew W. Hoffman Bobak Shahriari John Aslanides Gabriel Barth-Maron Nikola Momchev ... Srivatsan Srinivasan A. Cowie Ziyun Wang Bilal Piot Nando de Freitas 60 225 0 01 Jun 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020