Reinforcement Learning for Markovian Bandits: Is Posterior Sampling more Scalable than Optimism?

16 June 2021

Papers citing "Reinforcement Learning for Markovian Bandits: Is Posterior Sampling more Scalable than Optimism?"

1 / 1 papers shown

Title
Improved Worst-Case Regret Bounds for Randomized Least-Squares Value Iteration Priyank Agrawal Jinglin Chen Nan Jiang 27 18 0 23 Oct 2020