Improved Variance-Aware Confidence Sets for Linear Bandits and Linear Mixture MDP

29 January 2021

Papers citing "Improved Variance-Aware Confidence Sets for Linear Bandits and Linear Mixture MDP"

3 / 3 papers shown

Title
UCB Momentum Q-learning: Correcting the bias without forgetting Pierre Menard O. D. Domingues Xuedong Shang Michal Valko 53 35 0 01 Mar 2021
Instance-Wise Minimax-Optimal Algorithms for Logistic Bandits Marc Abeille Louis Faury Clément Calauzènes 83 32 0 23 Oct 2020
Optimism in Reinforcement Learning with Generalized Linear Function Approximation Yining Wang Ruosong Wang S. Du A. Krishnamurthy 102 128 0 09 Dec 2019