v1v2 (latest)

Restless-UCB, an Efficient and Low-complexity Algorithm for Online Restless Bandits

5 November 2020

Papers citing "Restless-UCB, an Efficient and Low-complexity Algorithm for Online Restless Bandits"

20 / 20 papers shown

Model-Based Learning of Whittle indices

Joël Charles-Rebuffé

Nicolas Gast

B. Gaujal

25 Nov 2025

On the Low-Complexity of Fair Learning for Combinatorial Multi-Armed BanditIEEE Conference on Computer Communications (IEEE INFOCOM), 2025

382

01 Jan 2025

DOPL: Direct Online Preference Learning for Restless Bandits with Preference FeedbackInternational Conference on Learning Representations (ICLR), 2024

370

07 Oct 2024

Whittle Index Learning Algorithms for Restless Bandits with Constant StepsizesConference Information and Communication Technology (ICT), 2024

Vishesh Mittal

R. Meshram

Surya Prakash

176

06 Sep 2024

A Federated Online Restless Bandit Framework for Cooperative Resource Allocation

Jingwen Tong

Xinran Li

Liqun Fu

Jun Zhang

Khaled B. Letaief

301

12 Jun 2024

Tabular and Deep Learning for the Whittle Index

Francisco Robledo Relaño

Vivek Borkar

U. Ayesta

Konstantin Avrachenkov

287

04 Jun 2024

Restless Bandit Problem with Rewards Generated by a Linear Gaussian Dynamical System

J. Gornet

Bruno Sinopoli

284

15 May 2024

Provably Efficient Reinforcement Learning for Adversarial Restless Multi-Armed Bandits with Unknown Transitions and Bandit Feedback

Efstathia Soufleri

Jian Li

291

02 May 2024

Structured Reinforcement Learning for Delay-Optimal Data Transmission in Dense mmWave Networks

223

25 Apr 2024

Online Restless Multi-Armed Bandits with Long-Term Fairness ConstraintsAAAI Conference on Artificial Intelligence (AAAI), 2023

Shu-Fan Wang

Efstathia Soufleri

Jian Li

486

16 Dec 2023

Finite-Time Analysis of Whittle Index based Q-Learning for Restless Multi-Armed Bandits with Neural Network Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

Efstathia Soufleri

Jian Li

283

03 Oct 2023

Policy Optimization for Personalized Interventions in Behavioral HealthManufacturing & Service Operations Management (MSOM), 2023

Vivek F. Farias

225

21 Mar 2023

Approximately Stationary Bandits with KnapsacksAnnual Conference Computational Learning Theory (COLT), 2023

Giannis Fikioris

Éva Tardos

AAML

307

28 Feb 2023

Decision-Focused Evaluation: Analyzing Performance of Deployed Restless Multi-Arm Bandits

238

19 Jan 2023

Stochastic Rising BanditsInternational Conference on Machine Learning (ICML), 2022

Alberto Maria Metelli

F. Trovò

Matteo Pirola

Marcello Restelli

199

07 Dec 2022

Optimistic Whittle Index Policy: Online Learning for Restless BanditsAAAI Conference on Artificial Intelligence (AAAI), 2022

Kai Wang

Lily Xu

Aparna Taneja

Milind Tambe

231

30 May 2022

Whittle Index based Q-Learning for Wireless Edge Caching with Linear Function ApproximationIEEE/ACM Transactions on Networking (TON), 2022

386

26 Feb 2022

Reinforcement Learning for Finite-Horizon Restless Multi-Armed Multi-Action Bandits

Efstathia Soufleri

Jian Li

Rahul Singh

264

20 Sep 2021

Restless and Uncertain: Robust Policies for Restless Bandits via Deep Multi-Agent Reinforcement Learning

232

04 Jul 2021

Reinforcement Learning for Markovian Bandits: Is Posterior Sampling more Scalable than Optimism?

Nicolas Gast

B. Gaujal

K. Khun

335

16 Jun 2021