v1v2 (latest)

Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning

Neural Information Processing Systems (NeurIPS), 2020

11 February 2020

Papers citing "Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning"

47 / 47 papers shown

Confounding Robust Deep Reinforcement Learning: A Causal Approach

237

24 Oct 2025

Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees

Nan Jiang

Tengyang Xie

OffRL

239

05 Oct 2025

The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability

246

11 Jun 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

273

28 May 2025

Reinforcement Learning with Continuous Actions Under Unmeasured Confounding

1.0K

01 May 2025

Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding

Nishanth Venkatesh S.

Heeseung Bang

Andreas A. Malikopoulos

OffRL

239

01 Apr 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

380

08 Dec 2024

Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences

318

25 Jul 2024

OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators

291

27 May 2024

Bounding Causal Effects with Leaky Instruments

David S. Watson

Jordan Penn

L. Gunderson

Gecia Bravo Hermsdorff

Afsaneh Mastouri

Ricardo M. A. Silva

CML

285

05 Apr 2024

Predictive Performance Comparison of Decision Policies Under Confounding

502

01 Apr 2024

Efficient and Sharp Off-Policy Evaluation in Robust Markov Decision Processes

310

29 Mar 2024

Partial Counterfactual Identification of Continuous Outcomes with a Curvature Sensitivity ModelNeural Information Processing Systems (NeurIPS), 2023

Valentyn Melnychuk

Dennis Frauen

Stefan Feuerriegel

722

02 Jun 2023

Delphic Offline Reinforcement Learning under Nonidentifiable Hidden ConfoundingInternational Conference on Learning Representations (ICLR), 2023

289

01 Jun 2023

Personalized Pricing with Invalid Instrumental Variables: Identification, Estimation, and Policy Learning

214

24 Feb 2023

A Survey on Causal Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

534

10 Feb 2023

Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders

David Bruns-Smith

Angela Zhou

OffRL

696

01 Feb 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

361

29 Dec 2022

Quantile Off-Policy Evaluation via Deep Conditional Generative Learning

296

29 Dec 2022

Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private InformationManagement Sciences (MS), 2022

Zuyue Fu

222

23 Dec 2022

A Review of Off-Policy Evaluation in Reinforcement Learning

302

114

13 Dec 2022

Instrumental Variables in Causal Inference and Machine Learning: A SurveyACM Computing Surveys (ACM CSUR), 2022

306

12 Dec 2022

Offline Policy Evaluation and Optimization under ConfoundingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

426

29 Nov 2022

Causal Deep Reinforcement Learning Using Observational DataInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

247

28 Nov 2022

Off-Policy Evaluation for Episodic Partially Observable Markov Decision Processes under Non-Parametric ModelsNeural Information Processing Systems (NeurIPS), 2022

346

21 Sep 2022

Data-Driven Influence Functions for Optimization-Based Causal Inference

386

29 Aug 2022

Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments

359

23 Aug 2022

Future-Dependent Value-Based Off-Policy Evaluation in POMDPsNeural Information Processing Systems (NeurIPS), 2022

504

26 Jul 2022

Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

285

14 Jun 2022

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision ProcessesInternational Conference on Learning Representations (ICLR), 2022

432

26 May 2022

Model-Free and Model-Based Policy Evaluation when Causality is UncertainInternational Conference on Machine Learning (ICML), 2022

David Bruns-Smith

CML ELM OffRL

209

02 Apr 2022

Stochastic Causal Programming for Bounding Treatment EffectsCLEaR (CLEaR), 2022

519

22 Feb 2022

Off-Policy Confidence Interval Estimation with Confounded Markov Decision ProcessJournal of the American Statistical Association (JASA), 2022

462

22 Feb 2022

A Behavior Regularized Implicit Policy for Offline Reinforcement Learning

Huangjie Zheng

Mingyuan Zhou

209

19 Feb 2022

Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making

S. Parbhoo

Shalmali Joshi

Finale Doshi-Velez

ELM CML OffRL

296

20 Jan 2022

Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach

S. Saghafian

CML

427

08 Dec 2021

A Minimax Learning Approach to Off-Policy Evaluation in Confounded Partially Observable Markov Decision ProcessesInternational Conference on Machine Learning (ICML), 2021

428

12 Nov 2021

Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in Partially Observed Markov Decision ProcessesOperational Research (OR), 2021

Andrew Bennett

Nathan Kallus

OffRL

258

28 Oct 2021

On Covariate Shift of Latent Confounders in Imitation and Reinforcement Learning

Gal Dalal

380

13 Oct 2021

Partial Counterfactual Identification from Observational and Experimental DataInternational Conference on Machine Learning (ICML), 2021

Junzhe Zhang

Jin Tian

Elias Bareinboim

238

12 Oct 2021

Invariant Policy Learning: A Causal PerspectiveIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Niklas Pfister

634

01 Jun 2021

Universal Off-Policy EvaluationNeural Information Processing Systems (NeurIPS), 2021

332

26 Apr 2021

Estimating and Improving Dynamic Treatment Regimes With a Time-Varying Instrumental Variable

Shuxiao Chen

B. Zhang

331

15 Apr 2021

Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning

Zuyue Fu

340

19 Feb 2021

Sharp Sensitivity Analysis for Inverse Propensity Weighting via Quantile BalancingJournal of the American Statistical Association (JASA), 2021

Jacob Dorn

Kevin Guo

433

08 Feb 2021

Off-policy Evaluation in Infinite-Horizon Reinforcement Learning with Latent ConfoundersInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

212

27 Jul 2020

Off-policy Policy Evaluation For Sequential Decisions Under Unobserved ConfoundingNeural Information Processing Systems (NeurIPS), 2020

399

12 Mar 2020