Doubly Robust Off-Policy Actor-Critic: Convergence and Optimality

23 February 2021

Papers citing "Doubly Robust Off-Policy Actor-Critic: Convergence and Optimality"

7 / 7 papers shown

Title
Policy Gradient Converges to the Globally Optimal Policy for Nearly Linear-Quadratic Regulators Yin-Huan Han Meisam Razaviyayn Renyuan Xu 22 5 0 15 Mar 2023
Recent Advances in Reinforcement Learning in Finance B. Hambly Renyuan Xu Huining Yang OffRL 19 165 0 08 Dec 2021
Convergence Guarantees for Deep Epsilon Greedy Policy Learning Michael Rawson R. Balan 32 8 0 02 Dec 2021
Global Optimality and Finite Sample Analysis of Softmax Off-Policy Actor Critic under State Distribution Mismatch Shangtong Zhang Rémi Tachet des Combes Romain Laroche 17 10 0 04 Nov 2021
Sample and Communication-Efficient Decentralized Actor-Critic Algorithms with Finite-Time Analysis Ziyi Chen Yi Zhou Rongrong Chen Shaofeng Zou 13 24 0 08 Sep 2021
Finite-Sample Analysis of Off-Policy Natural Actor-Critic with Linear Function Approximation Zaiwei Chen S. Khodadadian S. T. Maguluri OffRL 43 29 0 26 May 2021
A Finite Time Analysis of Two Time-Scale Actor Critic Methods Yue Wu Weitong Zhang Pan Xu Quanquan Gu 88 145 0 04 May 2020