Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization

28 March 2023

Papers citing "Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization"

50 / 57 papers shown

Title
Generative Auto-Bidding with Value-Guided Explorations Jingtong Gao Yewen Li Shuai Mao Peng Jiang Nan Jiang ... Fei Pan Peng Jiang Kun Gai Bo An Xiangyu Zhao OffRL 36 0 0 20 Apr 2025
An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning Haoran Xu Shuozhe Li Harshit S. Sikchi S. Niekum Amy Zhang OffRL 20 0 0 17 Apr 2025
HEAT:History-Enhanced Dual-phase Actor-Critic Algorithm with A Shared Transformer Hong Yang OffRL 30 0 0 13 Apr 2025
Policy Constraint by Only Support Constraint for Offline Reinforcement Learning Yunkai Gao Jiaming Guo Fan Wu Rui Zhang OffRL 47 0 0 07 Mar 2025
DPR: Diffusion Preference-based Reward for Offline Reinforcement Learning Teng Pang Bingzheng Wang Guoqiang Wu Yilong Yin OffRL 57 0 0 03 Mar 2025
Data Center Cooling System Optimization Using Offline Reinforcement Learning Xianyuan Zhan Xiangyu Zhu Peng Cheng Xiao Hu Ziteng He ... Chenhui Liu Tianshun Hong Yan Liang Yunxin Liu Feng Zhao AI4CE 57 0 0 17 Feb 2025
Skill Expansion and Composition in Parameter Space Tenglong Liu J. Li Yinan Zheng Haoyi Niu Yixing Lan Xin Xu Xianyuan Zhan 47 4 0 09 Feb 2025
Dual Alignment Maximin Optimization for Offline Model-based RL Chi Zhou Wang Luo Haoran Li Congying Han Tiande Guo Zicheng Zhang OffRL 56 0 0 02 Feb 2025
SR-Reward: Taking The Path More Traveled Seyed Mahdi Basiri Azad Zahra Padar Gabriel Kalweit Joschka Boedecker OffRL 64 0 0 04 Jan 2025
Attention-Enhanced Short-Time Wiener Solution for Acoustic Echo Cancellation Fei Zhao Xueliang Zhang 29 0 0 25 Dec 2024
Q-Distribution guided Q-learning for offline reinforcement learning: Uncertainty penalized Q-value via consistency model Jing Zhang Linjiajie Fang Kexin Shi Wenjia Wang Bing-Yi Jing OffRL 25 0 0 27 Oct 2024
Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression Yixiu Mao Qi Wang Chen Chen Yun Qu Xiangyang Ji OffRL 32 3 0 25 Oct 2024
ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift Regularization The Viet Bui Thanh Hong Nguyen Tien Mai OffRL 16 0 0 02 Oct 2024
Robust off-policy Reinforcement Learning via Soft Constrained Adversary Kosuke Nakanishi Akihiro Kubo Yuji Yasui Shin Ishii 27 0 0 31 Aug 2024
q-exponential family for policy optimization Lingwei Zhu Haseeb Shah Han Wang Yukie Nagai Martha White OffRL 66 0 0 14 Aug 2024
Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement Learning Liyuan Mao Haoran Xu Weinan Zhang Xianyuan Zhan Amy Zhang OffRL 23 5 0 29 Jul 2024
FOSP: Fine-tuning Offline Safe Policy through World Models Chenyang Cao Yucheng Xin Silang Wu Longxiang He Zichen Yan Junbo Tan Xueqian Wang OffRL 34 0 0 06 Jul 2024
Is Value Learning Really the Main Bottleneck in Offline RL? Seohong Park Kevin Frans Sergey Levine Aviral Kumar OffRL 27 2 0 13 Jun 2024
Residual Learning and Context Encoding for Adaptive Offline-to-Online Reinforcement Learning Mohammadreza Nakhaei Aidan Scannell J. Pajarinen OffRL 32 1 0 12 Jun 2024
Augmenting Offline RL with Unlabeled Data Zhao Wang Briti Gangopadhyay Jia-Fong Yeh Shingo Takamatsu OffRL 21 0 0 11 Jun 2024
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning Yu Zhang Rui Yu Zhipeng Yao Wenyuan Zhang Jun Wang Liming Zhang OffRL 27 0 0 05 Jun 2024
Diffusion Actor-Critic: Formulating Constrained Policy Iteration as Diffusion Noise Regression for Offline Reinforcement Learning Linjiajie Fang Ruoxue Liu Jing Zhang Wenjia Wang Bing-Yi Jing OffRL 38 1 0 31 May 2024
OMPO: A Unified Framework for RL under Policy and Dynamics Shifts Yu-Juan Luo Tianying Ji Fuchun Sun Jianwei Zhang Huazhe Xu Xianyuan Zhan OffRL 40 3 0 29 May 2024
Offline-Boosted Actor-Critic: Adaptively Blending Optimal Historical Behaviors in Deep Off-Policy RL Yu-Juan Luo Tianying Ji Fuchun Sun Jianwei Zhang Huazhe Xu Xianyuan Zhan OffRL OnRL 16 2 0 28 May 2024
AlignIQL: Policy Alignment in Implicit Q-Learning through Constrained Optimization Longxiang He Li Shen Junbo Tan Xueqian Wang 26 1 0 28 May 2024
Hummer: Towards Limited Competitive Preference Dataset Li Jiang Yusen Wu Junwu Xiong Jingqing Ruan Yichuan Ding Qingpei Guo Zujie Wen Jun Zhou Xiaotie Deng 18 6 0 19 May 2024
Improving Offline Reinforcement Learning with Inaccurate Simulators Yiwen Hou Haoyuan Sun Jinming Ma Feng Wu OffRL 23 4 0 07 May 2024
Offline Reinforcement Learning with Behavioral Supervisor Tuning Padmanaba Srinivasan William J. Knottenbelt OffRL 14 1 0 25 Apr 2024
AFU: Actor-Free critic Updates in off-policy RL for continuous control Nicolas Perrin-Gilbert OffRL 19 0 0 24 Apr 2024
A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective Yunpeng Qing Shunyu Liu Jingyuan Cong Kaixuan Chen Yihe Zhou Mingli Song OffRL 16 0 0 12 Mar 2024
Conservative and Risk-Aware Offline Multi-Agent Reinforcement Learning for Digital Twins Eslam Eldeeb Houssem Sifaou Osvaldo Simeone M. Shehab Hirley Alves OffRL 25 3 0 13 Feb 2024
ODICE: Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update Liyuan Mao Haoran Xu Weinan Zhang Xianyuan Zhan 14 10 0 01 Feb 2024
Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model Yinan Zheng Jianxiong Li Dongjie Yu Yujie Yang Shengbo Eben Li Xianyuan Zhan Jingjing Liu OffRL 17 23 0 19 Jan 2024
Critic-Guided Decision Transformer for Offline Reinforcement Learning Yuanfu Wang Chao Yang Yinghong Wen Yu Liu Yu Qiao OffRL 14 5 0 21 Dec 2023
Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy Optimization Kun Lei Zhengmao He Chenhao Lu Kaizhe Hu Yang Gao Huazhe Xu OffRL OnRL 30 8 0 06 Nov 2023
SMORE: Score Models for Offline Goal-Conditioned Reinforcement Learning Harshit S. Sikchi Rohan Chitnis Ahmed Touati A. Geramifard Amy Zhang S. Niekum OffRL 23 2 0 03 Nov 2023
Robust Offline Reinforcement learning with Heavy-Tailed Rewards Jin Zhu Runzhe Wan Zhengling Qi S. Luo C. Shi OffRL 19 0 0 28 Oct 2023
Towards Robust Offline Reinforcement Learning under Diverse Data Corruption Rui Yang Han Zhong Jiawei Xu Amy Zhang Chong Zhang Lei Han Tong Zhang OffRL OnRL 27 15 0 19 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 19 18 0 10 Oct 2023
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning Trevor A. McInroe Adam Jelley Stefano V. Albrecht Amos Storkey OffRL OnRL 4 6 0 09 Oct 2023
H2O+: An Improved Framework for Hybrid Offline-and-Online RL with Dynamics Gaps Haoyi Niu Tianying Ji Bingqi Liu Haocheng Zhao Xiangyu Zhu Jianying Zheng Pengfei Huang Guyue Zhou Jianming Hu Xianyuan Zhan OffRL OnRL AI4CE 17 6 0 22 Sep 2023
HIQL: Offline Goal-Conditioned RL with Latent States as Actions Seohong Park Dibya Ghosh Benjamin Eysenbach Sergey Levine OffRL 10 43 0 22 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 13 23 0 21 Jul 2023
Offline Diversity Maximization Under Imitation Constraints Marin Vlastelica Jin Cheng Georg Martius Pavel Kolev OffRL 23 0 0 21 Jul 2023
Budgeting Counterfactual for Offline RL Yao Liu Pratik Chaudhari Rasool Fakoor OffRL 12 2 0 12 Jul 2023
Offline Reinforcement Learning with Imbalanced Datasets Li Jiang Sijie Cheng Jielin Qiu Haoran Xu Wai Kin Victor Chan Zhao Ding OffRL 11 3 0 06 Jul 2023
A Simple Unified Uncertainty-Guided Framework for Offline-to-Online Reinforcement Learning Siyuan Guo Yanchao Sun Jifeng Hu Sili Huang Hechang Chen Haiyin Piao Lichao Sun Yi-Ju Chang OffRL OnRL 16 7 0 13 Jun 2023
Look Beneath the Surface: Exploiting Fundamental Symmetry for Sample-Efficient Offline RL Peng Cheng Xianyuan Zhan Zhihao Wu Wenjia Zhang Shoucheng Song Han Wang Youfang Lin Li Jiang OffRL 22 9 0 07 Jun 2023
Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic Tianying Ji Yuping Luo Fuchun Sun Xianyuan Zhan Jianwei Zhang Huazhe Xu OffRL OnRL 16 14 0 05 Jun 2023
PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Ya-Qin Zhang OffRL OnRL 12 19 0 25 May 2023