v1v2v3v4 (latest)

Confidence Intervals for Policy Evaluation in Adaptive Experiments

Proceedings of the National Academy of Sciences of the United States of America (PNAS), 2019

7 November 2019

Papers citing "Confidence Intervals for Policy Evaluation in Adaptive Experiments"

31 / 81 papers shown

Best Arm Identification with Contextual Information under a Small Gap

383

15 Sep 2022

Multi-disciplinary fairness considerations in machine learning for clinical trialsConference on Fairness, Accountability and Transparency (FAccT), 2022

148

18 May 2022

Reinforcement Learning in Modern Biostatistics: Constructing Optimal Adaptive InterventionsInternational Statistical Review (ISR), 2022

253

04 Mar 2022

Synthetically Controlled Bandits

Vivek Farias

C. Moallemi

Tianyi Peng

Andrew Zheng

206

14 Feb 2022

Optimal Best Arm Identification in Two-Armed Bandits with a Fixed Budget under a Small Gap

665

12 Jan 2022

Efficient Inference Without Trading-off Regret in Bandits: An Allocation Probability Test for Thompson Sampling

Nina Deliu

Joseph Jay Williams

S. Villar

217

30 Oct 2021

Doubly Robust Interval Estimation for Optimal Policy Evaluation in Online LearningJournal of the American Statistical Association (JASA), 2021

345

29 Oct 2021

Learning to be Fair: A Consequentialist Approach to Equitable Decision-Making

295

18 Sep 2021

Debiasing Samples from Online Learning Using BootstrapInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

253

31 Jul 2021

Near-optimal inference in adaptive linear regression

255

05 Jul 2021

A Closer Look at the Worst-case Behavior of Multi-armed Bandit AlgorithmsNeural Information Processing Systems (NeurIPS), 2021

Anand Kalvit

A. Zeevi

242

03 Jun 2021

Off-Policy Evaluation via Adaptive Weighting with Data from Contextual BanditsKnowledge Discovery and Data Mining (KDD), 2021

241

03 Jun 2021

Risk Minimization from Adaptively Collected Data: Guarantees for Supervised and Policy LearningNeural Information Processing Systems (NeurIPS), 2021

190

03 Jun 2021

Post-Contextual-Bandit InferenceNeural Information Processing Systems (NeurIPS), 2021

166

01 Jun 2021

Deeply-Debiased Off-Policy Interval EstimationInternational Conference on Machine Learning (ICML), 2021

193

10 May 2021

Policy Learning with Adaptively Collected DataManagement Sciences (MS), 2021

267

05 May 2021

Statistical Inference with M-Estimators on Adaptively Collected DataNeural Information Processing Systems (NeurIPS), 2021

Kelly W. Zhang

Lucas Janson

Susan Murphy

OffRL

165

29 Apr 2021

Challenges in Statistical Analysis of Data Collected by a Bandit Algorithm: An Empirical Exploration in Applications to Adaptively Randomized Experiments

167

22 Mar 2021

Online Multi-Armed Bandits with Adaptive InferenceNeural Information Processing Systems (NeurIPS), 2021

Maria Dimakopoulou

Zhimei Ren

Zhengyuan Zhou

197

25 Feb 2021

Adaptive Doubly Robust Estimator from Non-stationary Logging Policy under a Convergence of Average Probability

Masahiro Kato

OffRL

182

17 Feb 2021

Weak Signal Asymptotics for Sequentially Randomized ExperimentsManagement Sciences (MS), 2021

Xueheng Kuang

Stefan Wager

463

25 Jan 2021

Policy design in experiments with unknown interference

Davide Viviano

Jess Rudder

415

16 Nov 2020

Off-Policy Evaluation of Bandit Algorithm from Dependent Samples under Batch Update Policy

Masahiro Kato

Yusuke Kaneko

OffRL

169

23 Oct 2020

Optimal Off-Policy Evaluation from Multiple Logging Policies

245

21 Oct 2020

The Adaptive Doubly Robust Estimator for Policy Evaluation in Adaptive Experiments and a Paradox Concerning Logging Policy

245

08 Oct 2020

Confidence Interval for Off-Policy Evaluation from Dependent Samples via Bandit Algorithm: Approach from Standardized Martingales

Masahiro Kato

OffRL

129

12 Jun 2020

Power Constrained BanditsMachine Learning in Health Care (MLHC), 2020

Finale Doshi-Velez

315

13 Apr 2020

Panel Experiments and Dynamic Causal Effects: A Finite Population PerspectiveQuantitative Economics (Quant. Econ.), 2020

Iavor Bojinov

Ashesh Rambachan

N. Shephard

285

22 Mar 2020

On conditional versus marginal bias in multi-armed banditsInternational Conference on Machine Learning (ICML), 2020

Jaehyeok Shin

Aaditya Ramdas

Alessandro Rinaldo

196

19 Feb 2020

Inference for Batched BanditsNeural Information Processing Systems (NeurIPS), 2020

Kelly W. Zhang

Lucas Janson

Susan Murphy

313

102

08 Feb 2020

Online Causal Inference for Advertising in Real-Time Bidding AuctionsMarketing science (Providence, R.I.) (MSPRI), 2019

271

22 Aug 2019