Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning

1 October 2019

Papers citing "Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning"

50 / 404 papers shown

Title
Social Interpretable Reinforcement Learning Leonardo Lucio Custode Giovanni Iacca OffRL 50 2 0 27 Jan 2024
P2DT: Mitigating Forgetting in task-incremental Learning with progressive prompt Decision Transformer Zhiyuan Wang Xiaoyang Qu Jing Xiao Bokui Chen Jianzong Wang CLL OffRL 26 1 0 22 Jan 2024
Solving Continual Offline Reinforcement Learning with Decision Transformer Kaixin Huang Li Shen Chen Zhao Chun Yuan Dacheng Tao CLL OffRL 41 5 0 16 Jan 2024
Functional Graphical Models: Structure Enables Offline Data-Driven Optimization J. Kuba Masatoshi Uehara Pieter Abbeel Sergey Levine AI4CE 34 4 0 08 Jan 2024
Uncertainty-Penalized Reinforcement Learning from Human Feedback with Diverse Reward LoRA Ensembles Yuanzhao Zhai Han Zhang Yu Lei Yue Yu Kele Xu Dawei Feng Bo Ding Huaimin Wang AI4CE 81 33 0 30 Dec 2023
Critic-Guided Decision Transformer for Offline Reinforcement Learning Yuanfu Wang Chao Yang Yinghong Wen Yu Liu Yu Qiao OffRL 46 11 0 21 Dec 2023
Robot Crowd Navigation in Dynamic Environment with Offline Reinforcement Learning Shuai Zhou Hao Fu Haodong He Wei Liu OffRL 39 0 0 18 Dec 2023
Diffused Task-Agnostic Milestone Planner Mineui Hong Minjae Kang Songhwai Oh 31 6 0 06 Dec 2023
ULMA: Unified Language Model Alignment with Human Demonstration and Point-wise Preference Tianchi Cai Xierui Song Jiyan Jiang Fei Teng Jinjie Gu Guannan Zhang ALM 21 4 0 05 Dec 2023
Supported Trust Region Optimization for Offline Reinforcement Learning Yongyi Mao Hongchang Zhang Chong Chen Yi Tian Xu Xiangyang Ji OffRL 47 14 0 15 Nov 2023
A Simple Solution for Offline Imitation from Observations and Examples with Possibly Incomplete Trajectories Kai Yan Alex Schwing Yu-xiong Wang OffRL 40 5 0 02 Nov 2023
Rethinking Decision Transformer via Hierarchical Reinforcement Learning Yi Ma Chenjun Xiao Hebin Liang Jianye Hao OffRL 32 6 0 01 Nov 2023
GOPlan: Goal-conditioned Offline Reinforcement Learning by Planning with Learned Models Mianchu Wang Rui Yang Xi Chen Hao Sun Meng Fang Giovanni Montana OffRL 41 9 0 30 Oct 2023
Train Once, Get a Family: State-Adaptive Balances for Offline-to-Online Reinforcement Learning Shenzhi Wang Qisen Yang Jiawei Gao Matthieu Lin Hao Chen Liwei Wu Ning Jia Shiji Song Gao Huang OffRL 44 13 0 27 Oct 2023
Controlled Decoding from Language Models Sidharth Mudgal Jong Lee H. Ganapathy Yaguang Li Tao Wang ... Michael Collins Trevor Strohman Jilin Chen Alex Beutel Ahmad Beirami 39 73 0 25 Oct 2023
Finetuning Offline World Models in the Real World Yunhai Feng Nicklas Hansen Ziyan Xiong Chandramouli Rajagopalan Xiaolong Wang OffRL OnRL 30 20 0 24 Oct 2023
COPR: Continual Learning Human Preference through Optimal Policy Regularization Han Zhang Lin Gui Yuanzhao Zhai Hui Wang Yu Lei Ruifeng Xu CLL 51 0 0 24 Oct 2023
Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for Autonomous Real-World Reinforcement Learning Jingyun Yang Max Sobol Mark Brandon Vu Archit Sharma Jeannette Bohg Chelsea Finn OffRL OnRL 40 21 0 23 Oct 2023
An Emulator for Fine-Tuning Large Language Models using Small Language Models Eric Mitchell Rafael Rafailov Archit Sharma Chelsea Finn Christopher D. Manning ALM 41 53 0 19 Oct 2023
Towards Robust Offline Reinforcement Learning under Diverse Data Corruption Rui Yang Han Zhong Jiawei Xu Amy Zhang Chong Zhang Lei Han Tong Zhang OffRL OnRL 46 15 0 19 Oct 2023
Investigating Uncertainty Calibration of Aligned Language Models under the Multiple-Choice Setting Guande He Peng Cui Jianfei Chen Wenbo Hu Jun Zhu 50 11 0 18 Oct 2023
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning Jianlan Luo Perry Dong Jeffrey Wu Aviral Kumar Xinyang Geng Sergey Levine OffRL 39 18 0 18 Oct 2023
Bootstrap Your Own Skills: Learning to Solve New Tasks with Large Language Model Guidance Jesse Zhang Jiahui Zhang Karl Pertsch Ziyi Liu Xiang Ren Minsuk Chang Shao-Hua Sun Joseph J Lim LLMAG LM&Ro 113 60 0 16 Oct 2023
Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias Max Sobol Mark Archit Sharma Fahim Tajwar Rafael Rafailov Sergey Levine Chelsea Finn OffRL OnRL 39 1 0 12 Oct 2023
Accountability in Offline Reinforcement Learning: Explaining Decisions with a Corpus of Examples Hao Sun Alihan Huyuk Daniel Jarrett M. Schaar OffRL 44 7 0 11 Oct 2023
Score Regularized Policy Optimization through Diffusion Behavior Huayu Chen Cheng Lu Zhengyi Wang Hang Su Jun Zhu 36 20 0 11 Oct 2023
Boosting Continuous Control with Consistency Policy Yuhui Chen Haoran Li Dongbin Zhao OffRL 46 20 0 10 Oct 2023
Memory-Consistent Neural Networks for Imitation Learning Kaustubh Sridhar Souradeep Dutta Dinesh Jayaraman James Weimer Insup Lee 46 8 0 09 Oct 2023
Planning to Go Out-of-Distribution in Offline-to-Online Reinforcement Learning Trevor A. McInroe Adam Jelley Stefano V. Albrecht Amos Storkey OffRL OnRL 33 6 0 09 Oct 2023
DiffCPS: Diffusion Model based Constrained Policy Search for Offline Reinforcement Learning Longxiang He Li Shen Linrui Zhang Junbo Tan Xueqian Wang OffRL 32 8 0 09 Oct 2023
Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration Ziqi Zhang Xiao Xiong Zifeng Zhuang Jinxin Liu Donglin Wang OffRL OnRL 53 0 0 07 Oct 2023
Understanding, Predicting and Better Resolving Q-Value Divergence in Offline-RL Yang Yue Rui Lu Bingyi Kang Shiji Song Gao Huang OffRL 40 16 0 06 Oct 2023
Learning to Reach Goals via Diffusion V. Jain Siamak Ravanbakhsh DiffM OffRL 43 3 0 04 Oct 2023
Efficient Planning with Latent Diffusion Wenhao Li DiffM 47 4 0 30 Sep 2023
Counterfactual Conservative Q Learning for Offline Multi-agent Reinforcement Learning Jianzhun Shao Yun Qu Chen Chen Hongchang Zhang Xiangyang Ji OffRL 31 19 0 22 Sep 2023
OpenChat: Advancing Open-source Language Models with Mixed-Quality Data Guan-Bo Wang Sijie Cheng Xianyuan Zhan Xiangang Li Sen Song Yang Liu ALM 29 233 0 20 Sep 2023
Q-Transformer: Scalable Offline Reinforcement Learning via Autoregressive Q-Functions Yevgen Chebotar Q. Vuong A. Irpan Karol Hausman F. Xia ... Brianna Zitkovich Tomas Jackson Kanishka Rao Chelsea Finn Sergey Levine OffRL 134 81 0 18 Sep 2023
Bootstrapping Adaptive Human-Machine Interfaces with Offline Reinforcement Learning Jensen Gao S. Reddy Glen Berseth Anca Dragan Sergey Levine OffRL 33 0 0 07 Sep 2023
Model-based Offline Policy Optimization with Adversarial Network Junming Yang Xingguo Chen Shengyuan Wang Bolei Zhang OffRL 27 2 0 05 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 32 8 0 04 Sep 2023
Multi-Objective Decision Transformers for Offline Reinforcement Learning Abdelghani Ghanem P. Ciblat Mounir Ghogho OffRL 40 1 0 31 Aug 2023
Structured World Models from Human Videos Russell Mendonca Shikhar Bahl Deepak Pathak LM&Ro 54 87 0 21 Aug 2023
AlphaStar Unplugged: Large-Scale Offline Reinforcement Learning Michaël Mathieu Sherjil Ozair Srivatsan Srinivasan Çağlar Gülçehre Shangtong Zhang ... Sergio Gomez Colmenarejo Aaron van den Oord Wojciech M. Czarnecki Nando de Freitas Oriol Vinyals OffRL 16 10 0 07 Aug 2023
Offline Reinforcement Learning with On-Policy Q-Function Regularization Laixi Shi Robert Dadashi Yuejie Chi Pablo Samuel Castro M. Geist OffRL 40 5 0 25 Jul 2023
Contrastive Example-Based Control Kyle Hatch Benjamin Eysenbach Rafael Rafailov Tianhe Yu Ruslan Salakhutdinov Sergey Levine Chelsea Finn OffRL 36 4 0 24 Jul 2023
HIQL: Offline Goal-Conditioned RL with Latent States as Actions Seohong Park Dibya Ghosh Benjamin Eysenbach Sergey Levine OffRL 35 47 0 22 Jul 2023
Offline Multi-Agent Reinforcement Learning with Implicit Global-to-Local Value Regularization Xiangsen Wang Haoran Xu Yinan Zheng Xianyuan Zhan OffRL 38 23 0 21 Jul 2023
Budgeting Counterfactual for Offline RL Yao Liu Pratik Chaudhari Rasool Fakoor OffRL 27 2 0 12 Jul 2023
Offline Reinforcement Learning with Imbalanced Datasets Li Jiang Sijie Cheng Jielin Qiu Haoran Xu Wai Kin Victor Chan Zhao Ding OffRL 42 3 0 06 Jul 2023
Elastic Decision Transformer Yueh-hua Wu Xiaolong Wang Masashi Hamaya OffRL 34 39 0 05 Jul 2023