Conservative Q-Learning for Offline Reinforcement Learning

8 June 2020

Papers citing "Conservative Q-Learning for Offline Reinforcement Learning"

50 / 392 papers shown

Title
S2P: State-conditioned Image Synthesis for Data Augmentation in Offline Reinforcement Learning Daesol Cho D. Shim H. J. Kim OffRL 42 11 0 30 Sep 2022
Programmable and Customized Intelligence for Traffic Steering in 5G Networks Using Open RAN Architectures Andrea Lacava Michele Polese R. Sivaraj Rahul Soundrarajan Bhawani Shanker Bhati Tarunjeet Singh Tommaso Zugno F. Cuomo Tommaso Melodia 32 80 0 28 Sep 2022
Latent Plans for Task-Agnostic Offline Reinforcement Learning Erick Rosete-Beas Oier Mees Gabriel Kalweit Joschka Boedecker Wolfram Burgard OffRL 33 81 0 19 Sep 2022
Age of Semantics in Cooperative Communications: To Expedite Simulation Towards Real via Offline Reinforcement Learning Xianfu Chen Zhifeng Zhao S. Mao Celimuge Wu Honggang Zhang M. Bennis OffRL 23 3 0 19 Sep 2022
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation Xiaoteng Ma Zhipeng Liang Jose H. Blanchet MingWen Liu Li Xia Jiheng Zhang Qianchuan Zhao Zhengyuan Zhou OOD OffRL 41 22 0 14 Sep 2022
Task-Agnostic Learning to Accomplish New Tasks Xianqi Zhang Xingtao Wang Xu Liu Wenrui Wang Xiaopeng Fan Debin Zhao OffRL 88 0 0 09 Sep 2022
Concept-modulated model-based offline reinforcement learning for rapid generalization Nicholas A. Ketz Praveen K. Pilly OffRL 27 1 0 07 Sep 2022
Dialogue Evaluation with Offline Reinforcement Learning Nurul Lubis Christian Geishauser Hsien-Chin Lin Carel van Niekerk Michael Heck Shutong Feng Milica Gavsić OffRL 19 4 0 02 Sep 2022
Efficient Planning in a Compact Latent Action Space Zhengyao Jiang Tianjun Zhang Michael Janner Yueying Li Tim Rocktaschel Edward Grefenstette Yuandong Tian OffRL 24 36 0 22 Aug 2022
Multi-Task Fusion via Reinforcement Learning for Long-Term User Satisfaction in Recommender Systems Qihua Zhang Junning Liu Yuzhuo Dai Yiyan Qi Yifan Yuan Kunlun Zheng Fan Huang Xianfeng Tan OffRL 24 50 0 09 Aug 2022
Differentiable Integrated Motion Prediction and Planning with Learnable Cost Function for Autonomous Driving Zhiyu Huang Haochen Liu Jingda Wu Chen Lv 37 92 0 21 Jul 2022
Addressing Optimism Bias in Sequence Modeling for Reinforcement Learning Adam R. Villaflor Zheng Huang Swapnil Pande John M. Dolan J. Schneider OffRL 25 23 0 21 Jul 2022
Human-to-Robot Imitation in the Wild Shikhar Bahl Abhi Gupta Deepak Pathak 30 163 0 19 Jul 2022
Making Linear MDPs Practical via Contrastive Representation Learning Tianjun Zhang Tongzheng Ren Mengjiao Yang Joseph E. Gonzalez Dale Schuurmans Bo Dai 25 44 0 14 Jul 2022
Offline Equilibrium Finding Shuxin Li Xinrun Wang Youzhi Zhang Jakub Cerny Pengdeng Li Hau Chan Bo An OffRL 43 2 0 12 Jul 2022
Don't Start From Scratch: Leveraging Prior Data to Automate Robotic Reinforcement Learning Homer Walke Jonathan Yang Albert Yu Aviral Kumar Jedrzej Orbik Avi Singh Sergey Levine OffRL OnRL 27 32 0 11 Jul 2022
Multi-objective Optimization of Notifications Using Offline Reinforcement Learning Prakruthi Prabhakar Yiping Yuan Guangyu Yang Wensheng Sun A. Muralidharan OffRL 28 6 0 07 Jul 2022
Offline RL Policies Should be Trained to be Adaptive Dibya Ghosh Anurag Ajay Pulkit Agrawal Sergey Levine OffRL 35 45 0 05 Jul 2022
Learning to Rearrange with Physics-Inspired Risk Awareness Meng Song Yuhan Liu Zhengqin Li Manmohan Chandraker 26 0 0 26 Jun 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 50 101 0 19 Jun 2022
SMPL: Simulated Industrial Manufacturing and Process Control Learning Environments Mohan Zhang Xiaozhou Wang Benjamin Decardi-Nelson Bo Song A. Zhang ... Jiayi Cheng Xiaohong Liu DengDeng Yu Matthew Poon Animesh Garg 13 4 0 17 Jun 2022
Bootstrapped Transformer for Offline Reinforcement Learning Kerong Wang Hanye Zhao Xufang Luo Kan Ren Weinan Zhang Dongsheng Li OffRL 16 37 0 17 Jun 2022
RL-GA: A Reinforcement Learning-Based Genetic Algorithm for Electromagnetic Detection Satellite Scheduling Problem Yanjie Song Luona Wei Qing Yang Jian Wu Lining Xing Y. Chen 14 85 0 12 Jun 2022
On the Role of Discount Factor in Offline Reinforcement Learning Haotian Hu Yiqin Yang Qianchuan Zhao Chongjie Zhang OffRL 29 18 0 07 Jun 2022
Offline RL for Natural Language Generation with Implicit Language Q Learning Charles Burton Snell Ilya Kostrikov Yi Su Mengjiao Yang Sergey Levine OffRL 128 102 0 05 Jun 2022
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Rameswar Panda Marc G. Bellemare OffRL OnRL 31 63 0 03 Jun 2022
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning David Brandfonbrener Rémi Tachet des Combes Romain Laroche OffRL 37 5 0 02 Jun 2022
A Mixture-of-Expert Approach to RL-based Dialogue Management Yinlam Chow Azamat Tulepbergenov Ofir Nachum Moonkyung Ryu Mohammad Ghavamzadeh Craig Boutilier MoE 19 14 0 31 May 2022
Non-Markovian policies occupancy measures Romain Laroche Rémi Tachet des Combes Jacob Buckman OffRL 37 1 0 27 May 2022
Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes Miao Lu Yifei Min Zhaoran Wang Zhuoran Yang OffRL 57 22 0 26 May 2022
Towards Learning Universal Hyperparameter Optimizers with Transformers Yutian Chen Xingyou Song Chansoo Lee Zehao Wang Qiuyi Zhang ... Greg Kochanski Arnaud Doucet MarcÁurelio Ranzato Sagi Perel Nando de Freitas 32 63 0 26 May 2022
Offline Policy Comparison with Confidence: Benchmarks and Baselines Anurag Koul Mariano Phielipp Alan Fern OffRL 28 0 0 22 May 2022
User-Interactive Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 25 11 0 21 May 2022
Planning with Diffusion for Flexible Behavior Synthesis Michael Janner Yilun Du J. Tenenbaum Sergey Levine DiffM 202 632 0 20 May 2022
Data Valuation for Offline Reinforcement Learning Amir Abolfazli Gregory Palmer D. Kudenko OffRL 20 0 0 19 May 2022
Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in Latent Space Kuan Fang Patrick Yin Ashvin Nair Sergey Levine OffRL 58 29 0 17 May 2022
How to Spend Your Robot Time: Bridging Kickstarting and Offline Reinforcement Learning for Vision-based Robotic Manipulation Alex X. Lee Coline Devin Jost Tobias Springenberg Yuxiang Zhou Thomas Lampe A. Abdolmaleki Konstantinos Bousmalis OffRL OnRL 21 15 0 06 May 2022
BATS: Best Action Trajectory Stitching I. Char Viraj Mehta Adam R. Villaflor John M. Dolan J. Schneider OffRL 30 8 0 26 Apr 2022
Forgetting and Imbalance in Robot Lifelong Learning with Off-policy Data Wenxuan Zhou Steven Bohez Jan Humplik A. Abdolmaleki Dushyant Rao Markus Wulfmeier Tuomas Haarnoja N. Heess OffRL 32 6 0 12 Apr 2022
Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes Harry Emerson Matt Guy Ryan McConville OffRL 32 46 0 07 Apr 2022
Off-Policy Evaluation with Online Adaptation for Robot Exploration in Challenging Environments Yafei Hu Junyi Geng Chen Wang John Keller Sebastian Scherer OffRL 28 15 0 07 Apr 2022
Jump-Start Reinforcement Learning Ikechukwu Uchendu Ted Xiao Yao Lu Banghua Zhu Mengyuan Yan ... Chuyuan Fu Cong Ma Jiantao Jiao Sergey Levine Karol Hausman OffRL OnRL 38 109 0 05 Apr 2022
Demonstration-Bootstrapped Autonomous Practicing via Multi-Task Reinforcement Learning Abhishek Gupta Corey Lynch Brandon Kinman Garrett Peake Sergey Levine Karol Hausman OffRL 19 17 0 29 Mar 2022
Infinite-Horizon Reach-Avoid Zero-Sum Games via Deep Reinforcement Learning Jingqi Li Donggun Lee Somayeh Sojoudi Claire Tomlin 11 11 0 18 Mar 2022
RB2: Robotic Manipulation Benchmarking with a Twist Sudeep Dasari Jianren Wang Joyce Hong Shikhar Bahl Yixin Lin ... David Held Lerrel Pinto Deepak Pathak Vikash Kumar Abhi Gupta 29 27 0 15 Mar 2022
The Efficacy of Pessimism in Asynchronous Q-Learning Yuling Yan Gen Li Yuxin Chen Jianqing Fan OffRL 78 40 0 14 Mar 2022
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning Jinxin Liu Hongyin Zhang Donglin Wang OffRL 35 32 0 13 Mar 2022
Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with Pessimism Ming Yin Yaqi Duan Mengdi Wang Yu-Xiang Wang OffRL 34 65 0 11 Mar 2022
Offline Deep Reinforcement Learning for Dynamic Pricing of Consumer Credit Raad Khraishi Ramin Okhrati OffRL 23 5 0 06 Mar 2022
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Zhuoran Yang Zhihong Deng Animesh Garg Peng Liu Zhaoran Wang OffRL 31 132 0 23 Feb 2022