State Regularized Policy Optimization on Data with Dynamics Shift

6 June 2023

Papers citing "State Regularized Policy Optimization on Data with Dynamics Shift"

8 / 8 papers shown

Title
Policy Regularization on Globally Accessible States in Cross-Dynamics Reinforcement Learning Zhenghai Xue Lang Feng Jiacheng Xu Kang Kang Xiang Wen Bo An Shuicheng Yan OffRL 42 0 0 10 Mar 2025
Skill Expansion and Composition in Parameter Space Tenglong Liu J. Li Yinan Zheng Haoyi Niu Yixing Lan Xin Xu Xianyuan Zhan 53 4 0 09 Feb 2025
Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning Xiaoyu Wen Chenjia Bai Kang Xu Xudong Yu Yang Zhang Xuelong Li Zhen Wang 34 2 0 10 May 2024
AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems Zhenghai Xue Qingpeng Cai Tianyou Zuo Bin Yang Lantao Hu Peng Jiang Kun Gai 23 1 0 06 Oct 2023
Guarded Policy Optimization with Imperfect Online Demonstrations Zhenghai Xue Zhenghao Peng Quanyi Li Zhihan Liu Bolei Zhou OffRL 37 10 0 03 Mar 2023
Online Reinforcement Learning in Non-Stationary Context-Driven Environments Pouya Hamadanian Arash Nasr-Esfahany Malte Schwarzkopf Siddartha Sen MohammadIman Alizadeh CLL OffRL 40 0 0 04 Feb 2023
Softmax Deep Double Deterministic Policy Gradients Ling Pan Qingpeng Cai Longbo Huang 72 86 0 19 Oct 2020
Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks Chelsea Finn Pieter Abbeel Sergey Levine OOD 243 11,568 0 09 Mar 2017