Mirror Descent Policy Optimization

20 May 2020

Papers citing "Mirror Descent Policy Optimization"

8 / 58 papers shown

Title
Improved Regret Bound and Experience Replay in Regularized Policy Iteration N. Lazić Dong Yin Yasin Abbasi-Yadkori Csaba Szepesvári OffRL 6 17 0 25 Feb 2021
Dealing with Non-Stationarity in MARL via Trust-Region Decomposition Wenhao Li Xiangfeng Wang Bo Jin Junjie Sheng H. Zha 31 7 0 21 Feb 2021
Online Apprenticeship Learning Lior Shani Tom Zahavy Shie Mannor OffRL 24 25 0 13 Feb 2021
Optimization Issues in KL-Constrained Approximate Policy Iteration N. Lazić Botao Hao Yasin Abbasi-Yadkori Dale Schuurmans Csaba Szepesvári 19 10 0 11 Feb 2021
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes Guanghui Lan 99 136 0 30 Jan 2021
On the role of planning in model-based deep reinforcement learning Jessica B. Hamrick A. Friesen Feryal M. P. Behbahani A. Guez Fabio Viola Sims Witherspoon Thomas W. Anthony Lars Buesing Petar Velickovic T. Weber OffRL 27 65 0 08 Nov 2020
Policy Optimization with Stochastic Mirror Descent Long Yang Yu Zhang Gang Zheng Qian Zheng Pengfei Li Jianhang Huang Jun Wen Gang Pan 31 34 0 25 Jun 2019
Greedy Actor-Critic: A New Conditional Cross-Entropy Method for Policy Improvement Samuel Neumann Sungsu Lim A. Joseph Yangchen Pan Adam White Martha White 28 7 0 22 Oct 2018