v1v2v3 (latest)

Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings

13 January 2020

ArXiv (abs)PDF HTML Github (5★)

Papers citing "Statistical Inference of the Value Function for Reinforcement Learning in Infinite Horizon Settings"

50 / 63 papers shown

A Two-armed Bandit Framework for A/B Testing

221

24 Jul 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

249

28 May 2025

Reinforcement Learning with Continuous Actions Under Unmeasured Confounding

992

01 May 2025

IGN : Implicit Generative NetworksInternational Conference on Machine Learning and Applications (ICMLA), 2022

415

24 Feb 2025

Statistical Inference in Reinforcement Learning: A Selective Survey

Chengchun Shi

OffRL

691

22 Feb 2025

Counterfactually Fair Reinforcement Learning via Sequential Data Preprocessing

548

10 Jan 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

370

08 Dec 2024

Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences

313

25 Jul 2024

Dynamic Online Recommendation for Two-Sided Market with Bayesian Incentive Compatibility

Yuantong Li

Guang Cheng

Xiaowu Dai

238

04 Jun 2024

Combining Experimental and Historical Data for Policy Evaluation

481

01 Jun 2024

Estimation of subsidiary performance metrics under optimal policiesStatistica sinica (SS), 2024

Zhaoqi Li

Houssam Nassif

Alex Luedtke

217

08 Jan 2024

Neural Network Approximation for Pessimistic Offline Reinforcement Learning

Yuling Jiao

300

19 Dec 2023

AI in Pharma for Personalized Sequential Decision-Making: Methods, Applications and Opportunities

190

30 Nov 2023

Online Estimation and Inference for Robust Policy Evaluation in Reinforcement Learning

422

04 Oct 2023

Estimation and Inference in Distributional Reinforcement Learning

Yang Peng

Wenhao Yang

201

29 Sep 2023

Stackelberg Batch Policy Learning

Wenzhuo Zhou

Annie Qu

OffRL

328

28 Sep 2023

Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework

Annie Qu

327

23 Sep 2023

Statistical Inference on Multi-armed Bandits with Delayed FeedbackInternational Conference on Machine Learning (ICML), 2023

Lei Shi

Jingshen Wang

Tianhao Wu

355

03 Jul 2023

Off-policy Evaluation in Doubly Inhomogeneous EnvironmentsJournal of the American Statistical Association (JASA), 2023

328

14 Jun 2023

Testing for the Markov Property in Time Series via Deep Conditional Generative LearningJournal of The Royal Statistical Society Series B-statistical Methodology (JRSSB), 2023

215

30 May 2023

Evaluating Dynamic Conditional Quantile Treatment Effects with Applications in RidesharingJournal of the American Statistical Association (JASA), 2023

261

17 May 2023

Conformal Off-Policy Evaluation in Markov Decision ProcessesIEEE Conference on Decision and Control (CDC), 2023

425

05 Apr 2023

Sequential Knockoffs for Variable Selection in Reinforcement Learning

347

24 Mar 2023

Statistical Inference with Stochastic Gradient Methods under

ϕ

407

24 Feb 2023

Offline Minimax Soft-Q-learning Under Realizability and Partial CoverageNeural Information Processing Systems (NeurIPS), 2023

389

05 Feb 2023

Revisiting Bellman Errors for Offline Model SelectionInternational Conference on Machine Learning (ICML), 2023

Joshua P. Zitovsky

Daniel de Marchi

Rishabh Agarwal

Michael R. Kosorok University of North Carolina at Chapel Hill

OffRL

335

31 Jan 2023

A Reinforcement Learning Framework for Dynamic Mediation AnalysisInternational Conference on Machine Learning (ICML), 2023

393

31 Jan 2023

STEEL: Singularity-aware Reinforcement Learning

490

30 Jan 2023

Asymptotic Inference for Multi-Stage Stationary Treatment Policy with Variable Selection

289

29 Jan 2023

Quasi-optimal Reinforcement Learning with Continuous ActionsInternational Conference on Learning Representations (ICLR), 2023

276

21 Jan 2023

Value Enhancement of Reinforcement Learning via Efficient and Robust Trust Region OptimizationJournal of the American Statistical Association (JASA), 2023

227

05 Jan 2023

Deep Spectral Q-learning with Application to Mobile Health

Yuhe Gao

C. Shi

R. Song

198

03 Jan 2023

Inference on Time Series Nonparametric Conditional Moment Restrictions Using General Sieves

Xiaohong Chen

Yuan Liao

Weichen Wang

227

31 Dec 2022

Online Statistical Inference for Contextual Bandits via Stochastic Gradient Descent

Zhihong Liu

Yichen Zhang

266

30 Dec 2022

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

361

29 Dec 2022

Quantile Off-Policy Evaluation via Deep Conditional Generative Learning

296

29 Dec 2022

A Review of Off-Policy Evaluation in Reinforcement Learning

299

114

13 Dec 2022

Doubly Inhomogeneous Reinforcement Learning

523

08 Nov 2022

Future-Dependent Value-Based Off-Policy Evaluation in POMDPsNeural Information Processing Systems (NeurIPS), 2022

499

26 Jul 2022

Conformal Off-policy PredictionInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

319

14 Jun 2022

Testing Stationarity and Change Point Detection in Reinforcement LearningAnnals of Statistics (Ann. Stat.), 2022

582

03 Mar 2022

Statistically Efficient Advantage Learning for Offline Reinforcement Learning in Infinite HorizonsJournal of the American Statistical Association (JASA), 2022

278

26 Feb 2022

Policy Evaluation for Temporal and/or Spatial Dependent Experiments

634

22 Feb 2022

Off-Policy Confidence Interval Estimation with Confounded Markov Decision ProcessJournal of the American Statistical Association (JASA), 2022

444

22 Feb 2022

A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided MarketsAnnals of Applied Statistics (AOAS), 2022

426

21 Feb 2022

Off-Policy Fitted Q-Evaluation with Differentiable Function Approximators: Z-Estimation and Inference TheoryInternational Conference on Machine Learning (ICML), 2022

267

10 Feb 2022

278

09 Feb 2022

Reinforcement Learning with Heterogeneous Data: Estimation and Inference

289

31 Jan 2022

On Well-posedness and Minimax Optimal Rates of Nonparametric Q-function Estimation in Off-policy EvaluationInternational Conference on Machine Learning (ICML), 2022

Xiaohong Chen

Zhengling Qi

OffRL

494

17 Jan 2022

A Statistical Analysis of Polyak-Ruppert Averaged Q-learningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Wenhao Yang

448

29 Dec 2021