Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning

23 May 2024

Papers citing "Logarithmic Smoothing for Pessimistic Off-Policy Evaluation, Selection and Learning"

2 / 2 papers shown

Title
Off-Policy Evaluation for Large Action Spaces via Policy Convolution Noveen Sachdeva Lequn Wang Dawen Liang Nathan Kallus Julian McAuley OffRL 18 12 0 24 Oct 2023
Pac-Bayesian Supervised Classification: The Thermodynamics of Statistical Learning O. Catoni 135 451 0 03 Dec 2007