v1v2v3 (latest)

Doubly Robust Interval Estimation for Optimal Policy Evaluation in Online Learning

29 October 2021

Papers citing "Doubly Robust Interval Estimation for Optimal Policy Evaluation in Online Learning"

1 / 1 papers shown

Title
Anytime-valid off-policy inference for contextual bandits Ian Waudby-Smith Lili Wu Aaditya Ramdas Nikos Karampatziakis Paul Mineiro OffRL 119 30 0 19 Oct 2022