Batch Stationary Distribution Estimation

International Conference on Machine Learning (ICML), 2020

2 March 2020

Papers citing "Batch Stationary Distribution Estimation"

20 / 20 papers shown

One-Step Flow Policy Mirror Descent

353

31 Jul 2025

Scalable Offline Reinforcement Learning for Mean Field Games

282

23 Oct 2024

A Comprehensive Survey on Rare Event PredictionACM Computing Surveys (ACM Comput. Surv.), 2023

Chathurangi Shyalika

Ruwan Wickramarachchi

A. Sheth

AI4TS

309

20 Sep 2023

Model-based Offline Policy Optimization with Adversarial NetworkEuropean Conference on Artificial Intelligence (ECAI), 2023

218

05 Sep 2023

Inexact iterative numerical linear algebra for neural network-based spectral estimation and rare-event predictionJournal of Chemical Physics (JCP), 2023

386

22 Mar 2023

Nonparametric Density Estimation under Distribution DriftInternational Conference on Machine Learning (ICML), 2023

Alessio Mazzetto

E. Upfal

351

05 Feb 2023

Variational Latent Branching Model for Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2023

402

28 Jan 2023

Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State AbstractionAAAI Conference on Artificial Intelligence (AAAI), 2022

Brahma S. Pavse

Josiah P. Hanna

OffRL

228

14 Dec 2022

A Unified Framework for Alternating Offline Model Training and Policy LearningNeural Information Processing Systems (NeurIPS), 2022

322

12 Oct 2022

Continual Learning In Environments With Polynomial Mixing Times

Matthew D Riemer

Sharath Chandra Raparthy

246

13 Dec 2021

513

294

17 Nov 2021

Cautious Policy Programming: Exploiting KL Regularization in Monotonic Policy Improvement for Reinforcement Learning

208

13 Jul 2021

Autoregressive Dynamics Models for Offline Policy Evaluation and OptimizationInternational Conference on Learning Representations (ICLR), 2021

300

28 Apr 2021

Benchmarks for Deep Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2021

...

281

111

30 Mar 2021

Non-asymptotic Confidence Intervals of Off-policy Evaluation: Primal and Dual BoundsInternational Conference on Learning Representations (ICLR), 2021

299

09 Mar 2021

Provably Good Batch Reinforcement Learning Without Great Exploration

406

109

16 Jul 2020

Learning and Planning in Average-Reward Markov Decision Processes

Yi Wan

A. Naik

R. Sutton

OffRL

316

29 Jun 2020

A maximum-entropy approach to off-policy evaluation in average-reward MDPs

232

17 Jun 2020

Deep Reinforcement and InfoMax LearningNeural Information Processing Systems (NeurIPS), 2020

Bogdan Mazoure

Rémi Tachet des Combes

353

115

12 Jun 2020

Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems

1.3K

2,510

04 May 2020