v1v2v3 (latest)

Off-Policy Evaluation in Partially Observable Environments

AAAI Conference on Artificial Intelligence (AAAI), 2019

9 September 2019

Papers citing "Off-Policy Evaluation in Partially Observable Environments"

50 / 68 papers shown

Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees

Nan Jiang

Tengyang Xie

OffRL

242

05 Oct 2025

The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability

249

11 Jun 2025

Demystifying the Paradox of Importance Sampling with an Estimated History-Dependent Behavior Policy in Off-Policy Evaluation

276

28 May 2025

Automatic Reward Shaping from Confounded Offline Data

580

16 May 2025

Off-Policy Evaluation for Sequential Persuasion Process with Unobserved Confounding

Nishanth Venkatesh S.

Heeseung Bang

Andreas A. Malikopoulos

OffRL

253

01 Apr 2025

Time After Time: Deep-Q Effect Estimation for Interventions on When and What to doInternational Conference on Learning Representations (ICLR), 2025

Yoav Wald

M. Goldstein

Yonathan Efroni

Wouter A. C. van Amsterdam

Rajesh Ranganath

CML

404

20 Mar 2025

Statistical Tractability of Off-policy Evaluation of History-dependent Policies in POMDPsInternational Conference on Learning Representations (ICLR), 2025

Yuheng Zhang

Nan Jiang

OffRL

305

03 Mar 2025

Two-way Deconfounder for Off-policy Evaluation in Causal Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

386

08 Dec 2024

Data-Centric Approach to Constrained Machine Learning: A Case Study on Conway's Game of Life

A. Bibin

Anton Dereventsov

168

23 Aug 2024

Causal Deepsets for Off-policy Evaluation under Spatial or Spatio-temporal Interferences

318

25 Jul 2024

Benchmarks for Reinforcement Learning with Biased Offline Data and Imperfect Simulators

296

30 Jun 2024

RL in Latent MDPs is Tractable: Online Guarantees via Off-Policy Evaluation

Jeongyeol Kwon

Shie Mannor

Constantine Caramanis

Yonathan Efroni

OffRL

450

03 Jun 2024

OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators

298

27 May 2024

A CMDP-within-online framework for Meta-Safe Reinforcement Learning

Ming Jin

309

26 May 2024

On the Curses of Future and History in Future-dependent Value Functions for Off-policy Evaluation

Yuheng Zhang

Nan Jiang

OffRL

328

22 Feb 2024

Source Condition Double Robust Inference on Functionals of Inverse Problems

254

25 Jul 2023

Comparing Causal Frameworks: Potential Outcomes, Structural Models, Graphs, and AbstractionsNeural Information Processing Systems (NeurIPS), 2023

D. Ibeling

Thomas Icard

CML

291

25 Jun 2023

Reinforcement Learning with Temporal-Logic-Based Causal DiagramsInternational Cross-Domain Conference on Machine Learning and Knowledge Extraction (CD-MAKE), 2023

Yashi Paliwal

Rajarshi Roy

Jean-Raphael Gaglione

Ufuk Topcu

208

23 Jun 2023

Finding Counterfactually Optimal Action Sequences in Continuous State SpacesNeural Information Processing Systems (NeurIPS), 2023

Stratis Tsirtsis

Manuel Gomez Rodriguez

CML OffRL

438

06 Jun 2023

HOPE: Human-Centric Off-Policy Evaluation for E-Learning and HealthcareAdaptive Agents and Multi-Agent Systems (AAMAS), 2023

255

18 Feb 2023

A Survey on Causal Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

542

10 Feb 2023

Reinforcement Learning with History-Dependent Dynamic ContextsInternational Conference on Machine Learning (ICML), 2023

297

04 Feb 2023

Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders

David Bruns-Smith

Angela Zhou

OffRL

701

01 Feb 2023

Off-Policy Evaluation for Action-Dependent Non-Stationary EnvironmentsNeural Information Processing Systems (NeurIPS), 2023

Yash Chandak

Shiv Shankar

Nathaniel D. Bastian

Bruno Castro da Silva

Emma Brunskil

Philip S. Thomas

OffRL

272

24 Jan 2023

Safe Policy Improvement for POMDPs via Finite-State ControllersAAAI Conference on Artificial Intelligence (AAAI), 2023

296

12 Jan 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

365

29 Dec 2022

A Review of Off-Policy Evaluation in Reinforcement Learning

303

114

13 Dec 2022

Offline Policy Evaluation and Optimization under ConfoundingInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2022

430

29 Nov 2022

Causal Deep Reinforcement Learning Using Observational DataInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

253

28 Nov 2022

A Reinforcement Learning Approach to Estimating Long-term Treatment Effects

229

14 Oct 2022

Off-Policy Evaluation for Episodic Partially Observable Markov Decision Processes under Non-Parametric ModelsNeural Information Processing Systems (NeurIPS), 2022

348

21 Sep 2022

A Survey of Deep Causal Models and Their Industrial ApplicationsArtificial Intelligence Review (Artif Intell Rev), 2022

807

19 Sep 2022

Statistical Estimation of Confounded Linear MDPs: An Instrumental Variable Approach

Wenhao Yang

248

12 Sep 2022

Strategic Decision-Making in the Presence of Information Asymmetry: Provably Efficient RL with Algorithmic Instruments

363

23 Aug 2022

Future-Dependent Value-Based Off-Policy Evaluation in POMDPsNeural Information Processing Systems (NeurIPS), 2022

509

26 Jul 2022

Provably Efficient Reinforcement Learning in Partially Observable Dynamical SystemsNeural Information Processing Systems (NeurIPS), 2022

322

24 Jun 2022

Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision ProcessesInternational Conference on Learning Representations (ICLR), 2022

444

26 May 2022

Model-Free and Model-Based Policy Evaluation when Causality is UncertainInternational Conference on Machine Learning (ICML), 2022

David Bruns-Smith

CML ELM OffRL

216

02 Apr 2022

Off-Policy Confidence Interval Estimation with Confounded Markov Decision ProcessJournal of the American Statistical Association (JASA), 2022

471

22 Feb 2022

Long-term Causal Inference Under Persistent Confounding via Data Combination

596

15 Feb 2022

Generalizing Off-Policy Evaluation From a Causal Perspective For Sequential Decision-Making

S. Parbhoo

Shalmali Joshi

Finale Doshi-Velez

ELM CML OffRL

296

20 Jan 2022

Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach

S. Saghafian

CML

439

08 Dec 2021

A Minimax Learning Approach to Off-Policy Evaluation in Confounded Partially Observable Markov Decision ProcessesInternational Conference on Machine Learning (ICML), 2021

441

12 Nov 2021

Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in Partially Observed Markov Decision ProcessesOperational Research (OR), 2021

Andrew Bennett

Nathan Kallus

OffRL

262

28 Oct 2021

Off-Policy Evaluation in Partially Observed Markov Decision Processes under Sequential IgnorabilityAnnals of Statistics (Ann. Stat.), 2021

Yupeng Tang

Seung-seob Lee

OffRL

414

24 Oct 2021

On Covariate Shift of Latent Confounders in Imitation and Reinforcement Learning

Gal Dalal

384

13 Oct 2021

A Spectral Approach to Off-Policy Evaluation for POMDPs

Yash Nair

Nan Jiang

OffRL

244

22 Sep 2021

Learning-to-defer for sequential medical decision-making under uncertainty

Shalmali Joshi

S. Parbhoo

Finale Doshi-Velez

OffRL

272

13 Sep 2021

Direct Advantage Estimation

200

13 Sep 2021

Causal Reinforcement Learning using Observational and Interventional Data

258

28 Jun 2021