Convergent Actor-Critic Algorithms Under Off-Policy Training and Function Approximation

21 February 2018

Papers citing "Convergent Actor-Critic Algorithms Under Off-Policy Training and Function Approximation"

9 / 9 papers shown

Title
Coordinate Ascent for Off-Policy RL with Global Convergence Guarantees Hsin-En Su Yen-Ju Chen Ping-Chun Hsieh Xi Liu OffRL 45 0 0 10 Dec 2022
Finite-Sample Analysis of Off-Policy Natural Actor-Critic with Linear Function Approximation Zaiwei Chen S. Khodadadian S. T. Maguluri OffRL 68 29 0 26 May 2021
Doubly Robust Off-Policy Actor-Critic: Convergence and Optimality Tengyu Xu Zhuoran Yang Zhaoran Wang Yingbin Liang OffRL 52 24 0 23 Feb 2021
Decentralized Deterministic Multi-Agent Reinforcement Learning Antoine Grosnit D. Cai L. Wynter OffRL 19 7 0 19 Feb 2021
Finite-Sample Analysis of Off-Policy Natural Actor-Critic Algorithm S. Khodadadian Zaiwei Chen S. T. Maguluri CML OffRL 74 26 0 18 Feb 2021
Single-Timescale Actor-Critic Provably Finds Globally Optimal Policy Zuyue Fu Zhuoran Yang Zhaoran Wang 26 42 0 02 Aug 2020
Improving Sample Complexity Bounds for (Natural) Actor-Critic Algorithms Tengyu Xu Zhe Wang Yingbin Liang 32 25 0 27 Apr 2020
Actor-Critic Provably Finds Nash Equilibria of Linear-Quadratic Mean-Field Games Zuyue Fu Zhuoran Yang Yongxin Chen Zhaoran Wang 40 54 0 16 Oct 2019
Two Time-scale Off-Policy TD Learning: Non-asymptotic Analysis over Markovian Samples Tengyu Xu Shaofeng Zou Yingbin Liang 35 73 0 26 Sep 2019