Latent-Variable Advantage-Weighted Policy Optimization for Offline RL

Latent-Variable Advantage-Weighted Policy Optimization for Offline RL

16 March 2022

Ali Ghadirzadeh

Bin Liang

Papers citing "Latent-Variable Advantage-Weighted Policy Optimization for Offline RL"

14 / 14 papers shown

Title
Q-Distribution guided Q-learning for offline reinforcement learning: Uncertainty penalized Q-value via consistency model Jing Zhang Linjiajie Fang Kexin Shi Wenjia Wang Bing-Yi Jing OffRL 31 0 0 27 Oct 2024
The Role of Deep Learning Regularizations on Actors in Offline RL Denis Tarasov Anja Surina Çağlar Gülçehre OffRL AI4CE 48 1 0 11 Sep 2024
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? Denis Tarasov Kirill Brilliantov Dmitrii Kharlapenko OffRL 30 2 0 10 Jun 2024
Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning Tenglong Liu Yang Li Yixing Lan Hao Gao Wei Pan Xin Xu OffRL 34 5 0 30 May 2024
Katakomba: Tools and Benchmarks for Data-Driven NetHack Vladislav Kurenkov Alexander Nikulin Denis Tarasov Sergey Kolesnikov OffRL 30 5 0 14 Jun 2023
Improving Offline-to-Online Reinforcement Learning with Q-Ensembles Kai-Wen Zhao Yi-An Ma Jianye Hao Jinyi Liu Yan Zheng Zhaopeng Meng OffRL OnRL 18 12 0 12 Jun 2023
State Regularized Policy Optimization on Data with Dynamics Shift Zhenghai Xue Qingpeng Cai Shuchang Liu Dong Zheng Peng Jiang Kun Gai Bo An OffRL 28 16 0 06 Jun 2023
Constrained Policy Optimization with Explicit Behavior Density for Offline Reinforcement Learning Jing Zhang Chi Zhang Wenjia Wang Bing-Yi Jing OffRL 24 7 0 28 Jan 2023
Training and Evaluation of Deep Policies using Reinforcement Learning and Generative Models Ali Ghadirzadeh Petra Poklukar Karol Arndt Chelsea Finn Ville Kyrki Danica Kragic Marten Bjorkman OffRL 17 1 0 18 Apr 2022
Offline Reinforcement Learning with Implicit Q-Learning Ilya Kostrikov Ashvin Nair Sergey Levine OffRL 212 838 0 12 Oct 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 214 413 0 16 Feb 2021
EMaQ: Expected-Max Q-Learning Operator for Simple Yet Effective Offline and Online RL Seyed Kamyar Seyed Ghasemipour Dale Schuurmans S. Gu OffRL 209 119 0 21 Jul 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 329 1,951 0 04 May 2020
Meta Reinforcement Learning for Sim-to-real Domain Adaptation Karol Arndt Murtaza Hazara Ali Ghadirzadeh Ville Kyrki 104 104 0 16 Sep 2019