Logarithmic regret bounds for continuous-time average-reward Markov decision processes

23 May 2022

Papers citing "Logarithmic regret bounds for continuous-time average-reward Markov decision processes"

7 / 7 papers shown

Title
Reinforcement Learning for Intensity Control: An Application to Choice-Based Network Revenue Management Huiling Meng Ningyuan Chen Xuefeng Gao 55 1 0 08 Jun 2024
Reinforcement Learning and Regret Bounds for Admission Control Lucas Weber A. Busic Jiamin Zhu 16 0 0 07 Jun 2024
$ε$ -Policy Gradient for Online Pricing Lukasz Szpruch Tanut Treetanthiploet Yufei Zhang OffRL 44 1 0 06 May 2024
Statistical Learning with Sublinear Regret of Propagator Models Eyal Neuman Yufei Zhang 30 7 0 12 Jan 2023
Square-root regret bounds for continuous-time episodic Markov decision processes Xuefeng Gao X. Zhou 37 6 0 03 Oct 2022
Optimal scheduling of entropy regulariser for continuous-time linear-quadratic reinforcement learning Lukasz Szpruch Tanut Treetanthiploet Yufei Zhang 6 8 0 08 Aug 2022
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes Chen-Yu Wei Mehdi Jafarnia-Jahromi Haipeng Luo Hiteshi Sharma R. Jain 103 99 0 15 Oct 2019