v1v2 (latest)

Worst-case Performance of Greedy Policies in Bandits with Imperfect Context Observations

IEEE Conference on Decision and Control (CDC), 2022

10 April 2022

Mohamad Kazem Shirani Faradonbeh

Papers citing "Worst-case Performance of Greedy Policies in Bandits with Imperfect Context Observations"

2 / 2 papers shown

Title
Thompson Sampling in Partially Observable Contextual Bandits Hongju Park Mohamad Kazem Shirani Faradonbeh 210 4 0 15 Feb 2024
Online learning in bandits with predicted contextInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023 Yongyi Guo Ziping Xu Susan Murphy 187 5 0 26 Jul 2023