POTEC: Off-Policy Learning for Large Action Spaces via Two-Stage Policy Decomposition

9 February 2024

Papers citing "POTEC: Off-Policy Learning for Large Action Spaces via Two-Stage Policy Decomposition"

4 / 4 papers shown

Title
DOLCE: Decomposing Off-Policy Evaluation/Learning into Lagged and Current Effects Shu Tamano Masanori Nojima OffRL 37 0 0 02 May 2025
Prompt Optimization with Logged Bandit Data Haruka Kiyohara Daniel Yiming Cao Yuta Saito Thorsten Joachims 61 0 0 03 Apr 2025
Off-Policy Evaluation for Large Action Spaces via Policy Convolution Noveen Sachdeva Lequn Wang Dawen Liang Nathan Kallus Julian McAuley OffRL 21 12 0 24 Oct 2023
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes Nathan Kallus Masatoshi Uehara OffRL 31 180 0 22 Aug 2019