Divergence-Augmented Policy Optimization

28 January 2025

Papers citing "Divergence-Augmented Policy Optimization"

8 / 8 papers shown

Title
Mirror Descent Actor Critic via Bounded Advantage Learning Ryo Iwaki 93 0 0 06 Feb 2025
Prior-dependent analysis of posterior sampling reinforcement learning with function approximation Yingru Li Zhi-Quan Luo 24 1 0 17 Mar 2024
Policy Optimization with Smooth Guidance Learned from State-Only Demonstrations Guojian Wang Faguo Wu Xiao Zhang Tianyuan Chen Zhiming Zheng 36 0 0 30 Dec 2023
Increasing Entropy to Boost Policy Gradient Performance on Personalization Tasks Andrew Starnes Anton Dereventsov Clayton Webster 24 0 0 09 Oct 2023
The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy Measure Xing Chen Dongcui Diao Hechang Chen Hengshuai Yao Haiyin Piao Zhixiao Sun Zhiwei Yang Randy Goebel Bei Jiang Yi-Ju Chang OffRL 30 8 0 20 May 2022
Divergence-Regularized Multi-Agent Actor-Critic Kefan Su Zongqing Lu 46 25 0 01 Oct 2021
Bregman Gradient Policy Optimization Feihu Huang Shangqian Gao Heng-Chiao Huang 25 16 0 23 Jun 2021
Stable Policy Optimization via Off-Policy Divergence Regularization Ahmed Touati Amy Zhang Joelle Pineau Pascal Vincent OffRL 19 17 0 09 Mar 2020