Off-policy Policy Evaluation For Sequential Decisions Under Unobserved Confounding

Neural Information Processing Systems (NeurIPS), 2020

12 March 2020

Papers citing "Off-policy Policy Evaluation For Sequential Decisions Under Unobserved Confounding"

50 / 52 papers shown

Confounding Robust Deep Reinforcement Learning: A Causal Approach

180

24 Oct 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

183

28 May 2025

Time After Time: Deep-Q Effect Estimation for Interventions on When and What to doInternational Conference on Learning Representations (ICLR), 2025

Yoav Wald

M. Goldstein

Yonathan Efroni

Wouter A. C. van Amsterdam

Rajesh Ranganath

CML

374

20 Mar 2025

Statistical Tractability of Off-policy Evaluation of History-dependent Policies in POMDPsInternational Conference on Learning Representations (ICLR), 2025

Yuheng Zhang

Nan Jiang

OffRL

244

03 Mar 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

284

08 Dec 2024

Off-Policy Selection for Initiating Human-Centric Experimental DesignNeural Information Processing Systems (NeurIPS), 2024

295

26 Oct 2024

RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation

Jeongyeol Kwon

Shie Mannor

Constantine Caramanis

Yonathan Efroni

OffRL

392

03 Jun 2024

OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators

252

27 May 2024

Learning Decision Policies with Instrumental Variables through Double Machine LearningInternational Conference on Machine Learning (ICML), 2024

480

14 May 2024

Predictive Performance Comparison of Decision Policies Under Confounding

424

01 Apr 2024

Efficient and Sharp Off-Policy Evaluation in Robust Markov Decision Processes

278

29 Mar 2024

On the Curses of Future and History in Future-dependent Value Functions for Off-policy Evaluation

Yuheng Zhang

Nan Jiang

OffRL

246

22 Feb 2024

Distributionally Robust Policy Evaluation under General Covariate Shift in Contextual Bandits

251

21 Jan 2024

Off-Policy Evaluation for Large Action Spaces via Policy ConvolutionThe Web Conference (WWW), 2023

Julian McAuley

267

24 Oct 2023

Confounding-Robust Policy Improvement with Human-AI Teams

Ruijiang Gao

Mingzhang Yin

620

13 Oct 2023

Off-Policy Evaluation for Human FeedbackNeural Information Processing Systems (NeurIPS), 2023

322

11 Oct 2023

Offline Recommender System Evaluation under Unobserved Confounding

Olivier Jeunen

Ben London

OffRL

182

08 Sep 2023

Causal Reinforcement Learning: A Survey

345

04 Jul 2023

Comparing Causal Frameworks: Potential Outcomes, Structural Models, Graphs, and AbstractionsNeural Information Processing Systems (NeurIPS), 2023

D. Ibeling

Thomas Icard

CML

192

25 Jun 2023

Finding Counterfactually Optimal Action Sequences in Continuous State SpacesNeural Information Processing Systems (NeurIPS), 2023

Stratis Tsirtsis

Manuel Gomez Rodriguez

CML OffRL

328

06 Jun 2023

Delphic Offline Reinforcement Learning under Nonidentifiable Hidden ConfoundingInternational Conference on Learning Representations (ICLR), 2023

193

01 Jun 2023

HOPE: Human-Centric Off-Policy Evaluation for E-Learning and HealthcareAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

187

18 Feb 2023

A Survey on Causal Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

422

10 Feb 2023

Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders

David Bruns-Smith

Angela Zhou

OffRL

586

01 Feb 2023

Off-Policy Evaluation for Action-Dependent Non-Stationary EnvironmentsNeural Information Processing Systems (NeurIPS), 2023

Yash Chandak

Shiv Shankar

Nathaniel D. Bastian

Bruno Castro da Silva

Emma Brunskil

Philip S. Thomas

OffRL

207

24 Jan 2023

Off-Policy Evaluation with Out-of-Sample Guarantees

228

20 Jan 2023

Causal Falsification of Digital Twins

R. Cornish

Muhammad Faaiz Taufiq

Arnaud Doucet

Chris Holmes

SyDa CML

214

17 Jan 2023

Safe Policy Improvement for POMDPs via Finite-State ControllersAAAI Conference on Artificial Intelligence (AAAI), 2023

172

12 Jan 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

283

29 Dec 2022

Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private InformationManagement Sciences (MS), 2022

Zuyue Fu

179

23 Dec 2022

A Review of Off-Policy Evaluation in Reinforcement Learning

253

101

13 Dec 2022

Offline Policy Evaluation and Optimization under ConfoundingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

332

29 Nov 2022

Off-Policy Evaluation for Episodic Partially Observable Markov Decision Processes under Non-Parametric ModelsNeural Information Processing Systems (NeurIPS), 2022

319

21 Sep 2022

Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments

321

23 Aug 2022

Future-Dependent Value-Based Off-Policy Evaluation in POMDPsNeural Information Processing Systems (NeurIPS), 2022

413

26 Jul 2022

Model-Free and Model-Based Policy Evaluation when Causality is UncertainInternational Conference on Machine Learning (ICML), 2022

David Bruns-Smith

CML ELM OffRL

154

02 Apr 2022

Off-Policy Confidence Interval Estimation with Confounded Markov Decision ProcessJournal of the American Statistical Association (JASA), 2022

361

22 Feb 2022

Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making

S. Parbhoo

Shalmali Joshi

Finale Doshi-Velez

ELM CML OffRL

214

20 Jan 2022

Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach

S. Saghafian

CML

267

08 Dec 2021

Case-based off-policy policy evaluation using prototype learning

Anton Matsson

Fredrik D. Johansson

OffRL

144

22 Nov 2021

A Minimax Learning Approach to Off-Policy Evaluation in Confounded Partially Observable Markov Decision ProcessesInternational Conference on Machine Learning (ICML), 2021

305

12 Nov 2021

Causal Multi-Agent Reinforcement Learning: Review and Open Problems

St John Grimbly

Jonathan P. Shock

Arnu Pretorius

215

12 Nov 2021

Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in Partially Observed Markov Decision ProcessesOperational Research (OR), 2021

Andrew Bennett

Nathan Kallus

OffRL

231

28 Oct 2021

On Covariate Shift of Latent Confounders in Imitation and Reinforcement Learning

Gal Dalal

344

13 Oct 2021

Universal Off-Policy EvaluationNeural Information Processing Systems (NeurIPS), 2021

252

26 Apr 2021

Learning Under Adversarial and Interventional Shifts

Harvineet Singh

Shalmali Joshi

Finale Doshi-Velez

Himabindu Lakkaraju

OOD

170

29 Mar 2021

Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning

Zuyue Fu

278

19 Feb 2021

Causal Markov Decision Processes: Learning Good Interventions Efficiently

Yangyi Lu

A. Meisami

Ambuj Tewari

141

15 Feb 2021

Learning Deep Features in Instrumental Variable Regression

406

14 Oct 2020

Off-policy Evaluation in Infinite-Horizon Reinforcement Learning with Latent ConfoundersInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

167

27 Jul 2020