A Tractable Online Learning Algorithm for the Multinomial Logit Contextual Bandit

28 November 2020

Papers citing "A Tractable Online Learning Algorithm for the Multinomial Logit Contextual Bandit"

5 / 5 papers shown

Title
A Unified Regularization Approach to High-Dimensional Generalized Tensor Bandits Jiannan Li Yiyang Yang Shaojie Tang Yao Wang 38 0 0 18 Jan 2025
Provably Efficient Reinforcement Learning with Multinomial Logit Function Approximation Long-Fei Li Yu-Jie Zhang Peng Zhao Zhi-Hua Zhou 101 4 0 17 Jan 2025
Towards Scalable and Robust Structured Bandits: A Meta-Learning Framework Runzhe Wan Linjuan Ge Rui Song 18 13 0 26 Feb 2022
UCB-based Algorithms for Multinomial Logistic Regression Bandits Sanae Amani Christos Thrampoulidis 31 10 0 21 Mar 2021
Instance-Wise Minimax-Optimal Algorithms for Logistic Bandits Marc Abeille Louis Faury Clément Calauzènes 96 37 0 23 Oct 2020