v1v2 (latest)

An Actor-Critic Contextual Bandit Algorithm for Personalized Mobile Health Interventions

28 June 2017

Papers citing "An Actor-Critic Contextual Bandit Algorithm for Personalized Mobile Health Interventions"

18 / 18 papers shown

Diabetes Lifestyle Medicine Treatment Assistance Using Reinforcement Learning

Yuhan Tang

OffRL

101

19 Oct 2025

Improving Reward-Conditioned Policies for Multi-Armed Bandits using Normalized Weight Functions

Kai Xu

Farid Tajaddodianfar

Ben Allison

269

16 Jun 2024

Increasing Entropy to Boost Policy Gradient Performance on Personalization Tasks

Andrew Starnes

Anton Dereventsov

Clayton Webster

216

09 Oct 2023

Inference for relative sparsity

310

25 Jun 2023

Policy Optimization for Personalized Interventions in Behavioral HealthManufacturing & Service Operations Management (MSOM), 2023

Vivek F. Farias

231

21 Mar 2023

Examining Policy Entropy of Reinforcement Learning Agents for Personalization TasksInternational Conferences on Pattern Recognition and Artificial Intelligence (ICCPRAI), 2022

Anton Dereventsov

Andrew Starnes

Clayton Webster

388

21 Nov 2022

Simulated Contextual Bandits for Personalization Tasks from Recommendation Datasets

Anton Dereventsov

A. Bibin

192

12 Oct 2022

Robust Tests in Online Decision-MakingAAAI Conference on Artificial Intelligence (AAAI), 2022

170

21 Aug 2022

Quantum Multi-Armed Bandits and Stochastic Linear Bandits Enjoy Logarithmic RegretsAAAI Conference on Artificial Intelligence (AAAI), 2022

295

30 May 2022

Selectively Contextual Bandits

168

09 May 2022

Bounded Memory Adversarial Bandits with Composite Anonymous Delayed FeedbackInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Zongqi Wan

Xiaoming Sun

Jialin Zhang

221

27 Apr 2022

Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive InterventionsInternational Statistical Review (ISR), 2022

295

04 Mar 2022

Learning Neural Contextual Bandits Through Perturbed RewardsInternational Conference on Learning Representations (ICLR), 2022

Quanquan Gu

376

24 Jan 2022

From Personalized Medicine to Population Health: A Survey of mHealth Sensing Techniques

Haoyi Xiong

270

02 Jul 2021

Fatigue-Aware Ad Creative Selection

185

21 Aug 2019

Parameterized Exploration

Jesse Clifton

Lili Wu

E. Laber

211

13 Jul 2019

Balanced Linear Contextual Bandits

312

15 Dec 2018

Estimation Considerations in Contextual Bandits

527

19 Nov 2017