Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning

6 June 2020

Papers citing "Efficient Evaluation of Natural Stochastic Policies in Offline Reinforcement Learning"

18 / 18 papers shown

Title
Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation Yaqi Duan Mengdi Wang OffRL 129 151 0 21 Feb 2020
Statistically Efficient Off-Policy Policy Gradients Nathan Kallus Masatoshi Uehara OffRL 49 37 0 10 Feb 2020
Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning Ming Yin Yu Wang OffRL 88 82 0 29 Jan 2020
Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings C. Shi Shengyao Zhang W. Lu R. Song OffRL 26 87 0 13 Jan 2020
Off-Policy Estimation of Long-Term Average Outcomes with Applications to Mobile Health Peng Liao P. Klasnja Susan Murphy OffRL 46 68 0 30 Dec 2019
More Efficient Off-Policy Evaluation through Regularized Targeted Learning Aurélien F. Bibaut Ivana Malenica N. Vlassis Mark van der Laan OOD OffRL 29 40 0 13 Dec 2019
Minimax Weight and Q-Function Learning for Off-Policy Evaluation Masatoshi Uehara Jiawei Huang Nan Jiang OffRL 103 186 0 28 Oct 2019
Double Reinforcement Learning for Efficient Off-Policy Evaluation in Markov Decision Processes Nathan Kallus Masatoshi Uehara OffRL 68 185 0 22 Aug 2019
DualDICE: Behavior-Agnostic Estimation of Discounted Stationary Distribution Corrections Ofir Nachum Yinlam Chow Bo Dai Lihong Li OffRL 100 332 0 10 Jun 2019
Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning Nathan Kallus Masatoshi Uehara OffRL 57 54 0 09 Jun 2019
Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance Sampling Tengyang Xie Yifei Ma Yu Wang OffRL 86 181 0 08 Jun 2019
Deep Generalized Method of Moments for Instrumental Variable Analysis Andrew Bennett Nathan Kallus Tobias Schnabel 55 125 0 29 May 2019
Batch Policy Learning under Constraints Hoang Minh Le Cameron Voloshin Yisong Yue OffRL 45 328 0 20 Mar 2019
Breaking the Curse of Horizon: Infinite-Horizon Off-Policy Estimation Qiang Liu Lihong Li Ziyang Tang Dengyong Zhou OffRL 110 354 0 29 Oct 2018
Estimating Dynamic Treatment Regimes in Mobile Health Using V-learning Daniel J. Luckett Eric B. Laber A. Kahkoska D. Maahs E. Mayer‐Davis Michael R. Kosorok 41 137 0 10 Nov 2016
Data-Efficient Off-Policy Policy Evaluation for Reinforcement Learning Philip S. Thomas Emma Brunskill OffRL 264 573 0 04 Apr 2016
Doubly Robust Off-policy Value Evaluation for Reinforcement Learning Nan Jiang Lihong Li OffRL 155 621 0 11 Nov 2015
Effects of Treatment on the Treated: Identification and Generalization I. Shpitser Judea Pearl CML 75 81 0 09 May 2012