Accountable Off-Policy Evaluation With Kernel Bellman Statistics

15 August 2020

Papers citing "Accountable Off-Policy Evaluation With Kernel Bellman Statistics"

34 / 34 papers shown

Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees

Nan Jiang

Tengyang Xie

OffRL

176

05 Oct 2025

Sampling Complexity of TD and PPO in RKHS

29 Sep 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

183

28 May 2025

Statistical Inference in Reinforcement Learning: A Selective Survey

Chengchun Shi

OffRL

578

22 Feb 2025

Combining Experimental and Historical Data for Policy Evaluation

368

01 Jun 2024

Conservative Exploration for Policy Optimization via Off-Policy Policy Evaluation

200

24 Dec 2023

Probabilistic Offline Policy Ranking with Approximate Bayesian Computation

175

17 Dec 2023

Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework

Annie Qu

265

23 Sep 2023

Hallucinated Adversarial Control for Conservative Offline Policy EvaluationConference on Uncertainty in Artificial Intelligence (UAI), 2023

204

02 Mar 2023

A Reinforcement Learning Framework for Dynamic Mediation AnalysisInternational Conference on Machine Learning (ICML), 2023

247

31 Jan 2023

Value Enhancement of Reinforcement Learning via Efficient and Robust Trust Region OptimizationJournal of the American Statistical Association (JASA), 2023

182

05 Jan 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

286

29 Dec 2022

A Unified Framework for Alternating Offline Model Training and Policy LearningNeural Information Processing Systems (NeurIPS), 2022

229

12 Oct 2022

Conformal Off-policy PredictionInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

267

14 Jun 2022

Why So Pessimistic? Estimating Uncertainties for Offline RL through Ensembles, and Why Their Independence MattersNeural Information Processing Systems (NeurIPS), 2022

Seyed Kamyar Seyed Ghasemipour

S. Gu

Ofir Nachum

OffRL

220

27 May 2022

Bellman Residual Orthogonalization for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

Andrea Zanette

Martin J. Wainwright

OffRL

338

24 Mar 2022

Off-Policy Confidence Interval Estimation with Confounded Markov Decision ProcessJournal of the American Statistical Association (JASA), 2022

361

22 Feb 2022

Off-Policy Fitted Q-Evaluation with Differentiable Function Approximators: Z-Estimation and Inference TheoryInternational Conference on Machine Learning (ICML), 2022

231

10 Feb 2022

On Well-posedness and Minimax Optimal Rates of Nonparametric Q-function Estimation in Off-policy EvaluationInternational Conference on Machine Learning (ICML), 2022

Xiaohong Chen

Zhengling Qi

OffRL

403

17 Jan 2022

Hyperparameter Selection Methods for Fitted Q-Evaluation with Error Guarantee

Kohei Miyaguchi

OffRL

239

07 Jan 2022

Explaining Off-Policy Actor-Critic From A Bias-Variance Perspective

Ting-Han Fan

Peter J. Ramadge

CML FAtt OffRL

172

06 Oct 2021

Optimal policy evaluation using kernel-based temporal difference methodsAnnals of Statistics (Ann. Stat.), 2021

Yaqi Duan

Mengdi Wang

Martin J. Wainwright

OffRL

166

24 Sep 2021

Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic SettingsNeural Information Processing Systems (NeurIPS), 2021

Ming Yin

Yu Wang

OffRL

269

13 May 2021

Deeply-Debiased Off-Policy Interval EstimationInternational Conference on Machine Learning (ICML), 2021

193

10 May 2021

Nearly Horizon-Free Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2021

Sujay Sanghavi

259

25 Mar 2021

Infinite-Horizon Offline Reinforcement Learning with Linear Function Approximation: Curse of Dimensionality and Algorithm

316

17 Mar 2021

Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual BoundsInternational Conference on Learning Representations (ICLR), 2021

202

09 Mar 2021

Instabilities of Offline RL with Pre-Trained Neural RepresentationInternational Conference on Machine Learning (ICML), 2021

263

08 Mar 2021

Bootstrapping Fitted Q-Evaluation for Off-Policy InferenceInternational Conference on Machine Learning (ICML), 2021

Mengdi Wang

225

06 Feb 2021

Near-Optimal Offline Reinforcement Learning via Double Variance ReductionNeural Information Processing Systems (NeurIPS), 2021

Ming Yin

Yu Bai

Yu Wang

OffRL

236

02 Feb 2021

Offline Policy Selection under UncertaintyInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

207

12 Dec 2020

Off-Policy Interval Estimation with Lipschitz Value IterationNeural Information Processing Systems (NeurIPS), 2020

135

29 Oct 2020

What are the Statistical Limits of Offline RL with Linear Function Approximation?

381

169

22 Oct 2020

Batch Value-function Approximation with Only RealizabilityInternational Conference on Machine Learning (ICML), 2020

Tengyang Xie

Nan Jiang

OffRL

630

127

11 Aug 2020