Off-Policy Deep Reinforcement Learning without Exploration

7 December 2018

Papers citing "Off-Policy Deep Reinforcement Learning without Exploration"

50 / 339 papers shown

Title
Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced Datasets Zhang-Wei Hong Aviral Kumar Sathwik Karnik Abhishek Bhandwaldar Akash Srivastava Joni Pajarinen Romain Laroche Abhishek Gupta Pulkit Agrawal OffRL 38 19 0 06 Oct 2023
A General Offline Reinforcement Learning Framework for Interactive Recommendation Teng Xiao Donglin Wang OffRL 34 73 0 01 Oct 2023
Stackelberg Batch Policy Learning Wenzhuo Zhou Annie Qu OffRL 35 0 0 28 Sep 2023
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 36 0 0 26 Sep 2023
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps Haoyi Niu Tianying Ji Bingqi Liu Haocheng Zhao Xiangyu Zhu Jianying Zheng Pengfei Huang Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL AI4CE 27 6 0 22 Sep 2023
ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning Chenxiao Gao Chenyang Wu Mingjun Cao Rui Kong Zongzhang Zhang Yang Yu OffRL 31 13 0 12 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 26 8 0 04 Sep 2023
SMARLA: A Safety Monitoring Approach for Deep Reinforcement Learning Agents Amirhossein Zolfagharian Manel Abdellatif Lionel C. Briand S. Ramesh 25 5 0 03 Aug 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 33 28 0 28 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 33 23 0 21 Jul 2023
Robotic Manipulation Datasets for Offline Compositional Reinforcement Learning Marcel Hussing Jorge Armando Mendez Mendez Anisha Singrodia Cassandra Kent Eric Eaton OffRL 31 5 0 13 Jul 2023
Diffusion Policies for Out-of-Distribution Generalization in Offline Reinforcement Learning S. E. Ada Erhan Öztop Emre Ugur OffRL 42 15 0 10 Jul 2023
Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning Zhuoran Li Ling Pan Longbo Huang DiffM OffRL 23 7 0 04 Jul 2023
Is Risk-Sensitive Reinforcement Learning Properly Resolved? Ruiwen Zhou Minghuan Liu Kan Ren Xufang Luo Weinan Zhang Dongsheng Li 27 2 0 02 Jul 2023
Prioritized Trajectory Replay: A Replay Memory for Data-driven Reinforcement Learning Jinyi Liu Y. Ma Jianye Hao Yujing Hu Yan Zheng Tangjie Lv Changjie Fan OffRL 44 2 0 27 Jun 2023
Adaptive Ensemble Q-learning: Minimizing Estimation Bias via Error Feedback Hang Wang Sen Lin Junshan Zhang 21 19 0 20 Jun 2023
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding Alizée Pace Hugo Yèche Bernhard Schölkopf Gunnar Rätsch Guy Tennenholtz OffRL 16 6 0 01 Jun 2023
Safe Offline Reinforcement Learning with Real-Time Budget Constraints Qian Lin Bo Tang Zifan Wu Chao Yu Shangqin Mao Qianlong Xie Xingxing Wang Dong Wang OffRL 34 11 0 01 Jun 2023
Offline Meta Reinforcement Learning with In-Distribution Online Adaptation Jianhao Wang Jin Zhang Haozhe Jiang Junyu Zhang Liwei Wang Chongjie Zhang OffRL 26 9 0 31 May 2023
Passive learning of active causal strategies in agents and language models Andrew Kyle Lampinen Stephanie C. Y. Chan Ishita Dasgupta A. Nam Jane X. Wang 29 15 0 25 May 2023
Prompt-Tuning Decision Transformer with Preference Ranking Shengchao Hu Li Shen Ya Zhang Dacheng Tao OffRL 30 14 0 16 May 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 32 1 0 04 May 2023
Leveraging Factored Action Spaces for Efficient Offline Reinforcement Learning in Healthcare Shengpu Tang Maggie Makar Michael Sjoding Finale Doshi-Velez Jenna Wiens OffRL 53 37 0 02 May 2023
Efficient Deep Reinforcement Learning Requires Regulating Overfitting Qiyang Li Aviral Kumar Ilya Kostrikov Sergey Levine OffRL 24 31 0 20 Apr 2023
MAHALO: Unifying Offline Reinforcement Learning and Imitation Learning from Observations Anqi Li Byron Boots Ching-An Cheng OffRL 28 16 0 30 Mar 2023
Deep RL with Hierarchical Action Exploration for Dialogue Generation Itsugun Cho Ryota Takahashi Yusaku Yanase Hiroaki Saito 25 2 0 22 Mar 2023
Towards Real-World Applications of Personalized Anesthesia Using Policy Constraint Q Learning for Propofol Infusion Control Xiuding Cai Jiao Chen Yaoyao Zhu Beiming Wang Yu Yao OffRL 36 5 0 17 Mar 2023
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning Han Zheng Xufang Luo Pengfei Wei Xuan Song Dongsheng Li Jing Jiang OffRL OnRL 18 21 0 14 Mar 2023
Mastering Strategy Card Game (Legends of Code and Magic) via End-to-End Policy and Optimistic Smooth Fictitious Play Wei Xi Yongxin Zhang Changnan Xiao Xuefeng Huang Shihong Deng Haowei Liang Jie Chen Peng Sun OffRL 50 8 0 07 Mar 2023
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning Pengqin Wang Meixin Zhu Shaojie Shen OffRL 30 1 0 07 Mar 2023
Graph Decision Transformer Shengchao Hu Li Shen Ya Zhang Dacheng Tao OffRL 36 15 0 07 Mar 2023
Guarded Policy Optimization with Imperfect Online Demonstrations Zhenghai Xue Zhenghao Peng Quanyi Li Zhihan Liu Bolei Zhou OffRL 51 10 0 03 Mar 2023
Learning to Control Autonomous Fleets from Observation via Offline Reinforcement Learning Carolin Schmidt Daniele Gammelli Francisco Câmara Pereira Filipe Rodrigues OffRL 14 4 0 28 Feb 2023
The In-Sample Softmax for Offline Reinforcement Learning Chenjun Xiao Han Wang Yangchen Pan Adam White Martha White OffRL 29 26 0 28 Feb 2023
Gauss-Newton Temporal Difference Learning with Nonlinear Function Approximation Zhifa Ke Junyu Zhang Zaiwen Wen 24 0 0 25 Feb 2023
Neural Laplace Control for Continuous-time Delayed Systems Samuel Holt Alihan Huyuk Zhaozhi Qian Hao Sun M. Schaar OffRL 29 10 0 24 Feb 2023
Behavior Proximal Policy Optimization Zifeng Zhuang Kun Lei Jinxin Liu Donglin Wang Yilang Guo OffRL 30 34 0 22 Feb 2023
Demonstration-Guided Reinforcement Learning with Efficient Exploration for Task Automation of Surgical Robot Tao Huang Kai-xiang Chen Bin Li Yunhui Liu Qingxu Dou 35 23 0 20 Feb 2023
Swapped goal-conditioned offline reinforcement learning Wenyan Yang Huiling Wang Dingding Cai Joni Pajarinen Joni-Kristen Kämäräinen OffRL OnRL 36 1 0 17 Feb 2023
Efficient Online Reinforcement Learning with Offline Data Philip J. Ball Laura M. Smith Ilya Kostrikov Sergey Levine OffRL OnRL 34 163 0 06 Feb 2023
Policy Expansion for Bridging Offline-to-Online Reinforcement Learning Haichao Zhang Weiwen Xu Haonan Yu CLL OffRL OnRL 40 62 0 02 Feb 2023
Anti-Exploration by Random Network Distillation Alexander Nikulin Vladislav Kurenkov Denis Tarasov Sergey Kolesnikov 38 24 0 31 Jan 2023
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu Paria Rashidinejad Jiantao Jiao OffRL 38 15 0 30 Jan 2023
Constrained Policy Optimization with Explicit Behavior Density for Offline Reinforcement Learning Jing Zhang Chi Zhang Wenjia Wang Bing-Yi Jing OffRL 32 7 0 28 Jan 2023
A Survey of Meta-Reinforcement Learning Jacob Beck Risto Vuorio E. Liu Zheng Xiong L. Zintgraf Chelsea Finn Shimon Whiteson OOD OffRL 37 122 0 19 Jan 2023
A Survey on Transformers in Reinforcement Learning Wenzhe Li Hao Luo Zichuan Lin Chongjie Zhang Zongqing Lu Deheng Ye OffRL MU AI4CE 37 55 0 08 Jan 2023
Benchmarks and Algorithms for Offline Preference-Based Reward Learning Daniel Shin Anca Dragan Daniel S. Brown OffRL 17 53 0 03 Jan 2023
Offline Policy Optimization in RL with Variance Regularizaton Riashat Islam Samarth Sinha Homanga Bharadhwaj Samin Yeasar Arnob Zhuoran Yang Animesh Garg Zhaoran Wang Lihong Li Doina Precup OffRL 26 0 0 29 Dec 2022
Multi-embodiment Legged Robot Control as a Sequence Modeling Problem Chenyi Yu Weinan Zhang H. Lai Zheng Tian L. Kneip Jun Wang 31 15 0 18 Dec 2022
Safe Evaluation For Offline Learning: Are We Ready To Deploy? Hager Radi Josiah P. Hanna Peter Stone Matthew E. Taylor OffRL ELM 31 0 0 16 Dec 2022