GenDICE: Generalized Offline Estimation of Stationary Values

International Conference on Learning Representations (ICLR), 2020

21 February 2020

Papers citing "GenDICE: Generalized Offline Estimation of Stationary Values"

50 / 127 papers shown

Density-Ratio Weighted Behavioral Cloning: Learning Control Policies from Corrupted Datasets

Shriram Karpoora Sundara Pandian

Ali Baheri

OffRL

216

01 Oct 2025

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?

Glen Berseth

OffRL

196

02 Aug 2025

Policy-Based Trajectory Clustering in Offline Reinforcement Learning

386

10 Jun 2025

STITCH-OPE: Trajectory Stitching with Guided Diffusion for Off-Policy Evaluation

Hossein Goli

Michael Gimelfarb

Nathan Samuel de Lara

392

27 May 2025

An Optimal Discriminator Weighted Imitation Perspective for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

455

17 Apr 2025

Average-DICE: Stationary Distribution Correction by Regression

237

03 Mar 2025

SimuDICE: Offline Policy Optimization Through World Model Updates and DICE Estimation

336

09 Dec 2024

Concept-driven Off Policy Evaluation

345

28 Nov 2024

Scalable Offline Reinforcement Learning for Mean Field Games

275

23 Oct 2024

Primal-Dual Spectral Representation for Off-policy EvaluationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

320

23 Oct 2024

Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces

Zhejian Yang

250

21 Oct 2024

Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy EvaluationNeural Information Processing Systems (NeurIPS), 2024

Shreyas Chaudhari

Ameet Deshpande

Bruno Castro da Silva

Philip S. Thomas

OffRL

265

03 Oct 2024

Improving Deep Reinforcement Learning by Reducing the Chain Effect of Value and Policy ChurnNeural Information Processing Systems (NeurIPS), 2024

Hongyao Tang

Glen Berseth

OffRL

348

07 Sep 2024

Diffusion-DICE: In-Sample Diffusion Guidance for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

420

29 Jul 2024

A Dual Approach to Imitation Learning from Observations with Offline Datasets

Amy Zhang

306

13 Jun 2024

Towards Provable Log Density Policy Gradient

Pulkit Katdare

Anant Joshi

Katherine Driggs-Campbell

311

03 Mar 2024

Offline Multi-task Transfer RL with Representational Penalization

341

19 Feb 2024

The Virtues of Pessimism in Inverse Reinforcement Learning

354

04 Feb 2024

ODICE: Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update

380

01 Feb 2024

Learning from Sparse Offline Datasets via Conservative Density EstimationInternational Conference on Learning Representations (ICLR), 2024

Ding Zhao

307

16 Jan 2024

Conservative Exploration for Policy Optimization via Off-Policy Policy Evaluation

233

24 Dec 2023

SCOPE-RL: A Python Library for Offline Reinforcement Learning and Off-Policy Evaluation

535

30 Nov 2023

When is Off-Policy Evaluation Useful? A Data-Centric Perspective

331

23 Nov 2023

Train Once, Get a Family: State-Adaptive Balances for Offline-to-Online Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Gao Huang

386

27 Oct 2023

Off-Policy Evaluation for Human FeedbackNeural Information Processing Systems (NeurIPS), 2023

383

11 Oct 2023

Beyond Uniform Sampling: Offline Reinforcement Learning with Imbalanced DatasetsNeural Information Processing Systems (NeurIPS), 2023

Akash Srivastava

Abhishek Gupta

265

06 Oct 2023

Robust Offline Reinforcement Learning -- Certify the Confidence Interval

Aayush Mishra

Simon S. Du

OffRL

380

28 Sep 2023

Distributional Shift-Aware Off-Policy Interval Estimation: A Unified Error Quantification Framework

Annie Qu

327

23 Sep 2023

Marginalized Importance Sampling for Off-Environment Policy EvaluationConference on Robot Learning (CoRL), 2023

Pulkit Katdare

Nan Jiang

Katherine Driggs-Campbell

OffRL

394

04 Sep 2023

RePo: Resilient Model-Based Reinforcement Learning by Regularizing Posterior PredictabilityNeural Information Processing Systems (NeurIPS), 2023

Chuning Zhu

Max Simchowitz

Siri Gadipudi

Abhishek Gupta

375

31 Aug 2023

Benchmarking Offline Reinforcement Learning on Real-Robot HardwareInternational Conference on Learning Representations (ICLR), 2023

Stefan Bauer

339

28 Jul 2023

Hindsight-DICE: Stable Credit Assignment for Deep Reinforcement Learning

340

21 Jul 2023

Value-aware Importance Weighting for Off-policy Reinforcement Learning

268

27 Jun 2023

Self-Supervised Reinforcement Learning that Transfers using Random FeaturesNeural Information Processing Systems (NeurIPS), 2023

Abhishek Gupta

293

26 May 2023

A Survey of Demonstration Learning

André Rosa de Sousa Porfírio Correia

Luís A. Alexandre

OffRL

259

20 Mar 2023

Uncertainty-Aware Instance Reweighting for Off-Policy LearningNeural Information Processing Systems (NeurIPS), 2023

Yang Liu

303

11 Mar 2023

Offline Imitation Learning with Suboptimal Demonstrations via Relaxed Distribution MatchingAAAI Conference on Artificial Intelligence (AAAI), 2023

283

05 Mar 2023

Hallucinated Adversarial Control for Conservative Offline Policy EvaluationConference on Uncertainty in Artificial Intelligence (UAI), 2023

274

02 Mar 2023

Dual RL: Unification and New Methods for Reinforcement and Imitation LearningInternational Conference on Learning Representations (ICLR), 2023

409

16 Feb 2023

Constrained Decision Transformer for Offline Safe Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Wenhao Yu

Tingnan Zhang

Ding Zhao

OffRL

341

14 Feb 2023

A Reinforcement Learning Framework for Dynamic Mediation AnalysisInternational Conference on Machine Learning (ICML), 2023

393

31 Jan 2023

Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

523

30 Jan 2023

Variational Latent Branching Model for Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2023

402

28 Jan 2023

Generalized Munchausen Reinforcement Learning using Tsallis KL DivergenceNeural Information Processing Systems (NeurIPS), 2023

Lingwei Zhu

Zheng Chen

Takamitsu Matsubara

Martha White

307

27 Jan 2023

Model-based Offline Reinforcement Learning with Local MisspecificationAAAI Conference on Artificial Intelligence (AAAI), 2023

258

26 Jan 2023

An Instrumental Variable Approach to Confounded Off-Policy EvaluationInternational Conference on Machine Learning (ICML), 2022

361

29 Dec 2022

Offline Policy Optimization in RL with Variance Regularizaton

Homanga Bharadhwaj

168

29 Dec 2022

Policy learning "without" overlap: Pessimism and generalized empirical Bernstein's inequality

567

19 Dec 2022

Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State AbstractionAAAI Conference on Artificial Intelligence (AAAI), 2022

Brahma S. Pavse

Josiah P. Hanna

OffRL

224

14 Dec 2022

When is Realizability Sufficient for Off-Policy Reinforcement Learning?International Conference on Machine Learning (ICML), 2022

Andrea Zanette

OffRL

362

10 Nov 2022