v1v2v3 (latest)

Bootstrapping Fitted Q-Evaluation for Off-Policy Inference

International Conference on Machine Learning (ICML), 2021

6 February 2021

Mengdi Wang

Papers citing "Bootstrapping Fitted Q-Evaluation for Off-Policy Inference"

30 / 30 papers shown

A Tutorial: An Intuitive Explanation of Offline Reinforcement Learning Theory

Fengdi Che

OffRL

165

11 Aug 2025

Central Limit Theorems for Transition Probabilities of Controlled Markov Chains

207

02 Aug 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

207

28 May 2025

Reinforcement Learning with Continuous Actions Under Unmeasured Confounding

958

01 May 2025

Statistical Inference in Reinforcement Learning: A Selective Survey

Chengchun Shi

OffRL

630

22 Feb 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

328

08 Dec 2024

Towards Fast Safe Online Reinforcement Learning via Policy Finetuning

452

05 Dec 2024

Off-Policy Selection for Initiating Human-Centric Experimental DesignNeural Information Processing Systems (NeurIPS), 2024

332

26 Oct 2024

Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences

289

25 Jul 2024

Why long model-based rollouts are no reason for bad Q-value estimates

190

16 Jul 2024

Combining Experimental and Historical Data for Policy Evaluation

455

01 Jun 2024

Robust Offline Reinforcement learning with Heavy-Tailed RewardsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

364

28 Oct 2023

Off-Policy Evaluation for Human FeedbackNeural Information Processing Systems (NeurIPS), 2023

354

11 Oct 2023

Online Estimation and Inference for Robust Policy Evaluation in Reinforcement Learning

403

04 Oct 2023

Estimation and Inference in Distributional Reinforcement Learning

Yang Peng

Wenhao Yang

189

29 Sep 2023

Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework

Annie Qu

299

23 Sep 2023

Off-policy Evaluation in Doubly Inhomogeneous EnvironmentsJournal of the American Statistical Association (JASA), 2023

302

14 Jun 2023

K

-Nearest-Neighbor Resampling for Off-Policy Evaluation in Stochastic Control

233

07 Jun 2023

Did we personalize? Assessing personalization by an online reinforcement learning algorithm using resamplingMachine-mediated learning (ML), 2023

Kelly Zhang

Susan Murphy

OffRL

468

11 Apr 2023

On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent SamplesAAAI Conference on Artificial Intelligence (AAAI), 2023

Mustafa O. Karabag

Ufuk Topcu

OffRL

279

07 Mar 2023

A Reinforcement Learning Framework for Dynamic Mediation AnalysisInternational Conference on Machine Learning (ICML), 2023

358

31 Jan 2023

Variational Latent Branching Model for Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2023

378

28 Jan 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

339

29 Dec 2022

Quantile Off-Policy Evaluation via Deep Conditional Generative Learning

272

29 Dec 2022

Policy-Adaptive Estimator Selection for Off-Policy EvaluationAAAI Conference on Artificial Intelligence (AAAI), 2022

244

25 Nov 2022

Policy Optimization with Sparse Global Contrastive Explanations

Finale Doshi-Velez

193

13 Jul 2022

Conformal Off-policy PredictionInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

304

14 Jun 2022

Testing Stationarity and Change Point Detection in Reinforcement LearningAnnals of Statistics (Ann. Stat.), 2022

538

03 Mar 2022

Optimal Estimation of Off-Policy Policy Gradient via Double Fitted Iteration

358

31 Jan 2022

Statistical Testing under Distributional Shifts

Niklas Pfister

426

22 May 2021