On the Hidden Biases of Policy Mirror Ascent in Continuous Action Spaces

28 January 2022

Papers citing "On the Hidden Biases of Policy Mirror Ascent in Continuous Action Spaces"

6 / 6 papers shown

Title
Spurious Stationarity and Hardness Results for Mirror Descent He Chen Jiajin Li Anthony Man-Cho So 29 0 0 11 Apr 2024
Behind the Myth of Exploration in Policy Gradients Adrien Bolland Gaspard Lambrechts Damien Ernst 30 0 0 31 Jan 2024
Policy Gradient Algorithms Implicitly Optimize by Continuation Adrien Bolland Gilles Louppe D. Ernst 24 3 0 11 May 2023
Beyond Exponentially Fast Mixing in Average-Reward Reinforcement Learning via Multi-Level Monte Carlo Actor-Critic Wesley A. Suttle Amrit Singh Bedi Bhrij Patel Brian M. Sadler Alec Koppel Dinesh Manocha 8 13 0 28 Jan 2023
STEERING: Stein Information Directed Exploration for Model-Based Reinforcement Learning Souradip Chakraborty Amrit Singh Bedi Alec Koppel Mengdi Wang Furong Huang Dinesh Manocha 11 7 0 28 Jan 2023
Policy Mirror Descent for Reinforcement Learning: Linear Convergence, New Sampling Complexity, and Generalized Problem Classes Guanghui Lan 87 135 0 30 Jan 2021