Hyperparameter Selection for Offline Reinforcement Learning

17 July 2020

Papers citing "Hyperparameter Selection for Offline Reinforcement Learning"

50 / 104 papers shown

Towards an Adaptive Social Game-Playing Robot: An Offline Reinforcement Learning-Based Framework

172

21 Sep 2025

SOReL and TOReL: Two Methods for Fully Offline Reinforcement Learning

362

28 May 2025

A Clean Slate for Offline Reinforcement Learning

497

15 Apr 2025

Hyperparameter Optimisation with Practical Interpretability and Explanation Methods in Probabilistic Curriculum Learning

Llewyn Salt

Marcus Gallagher

309

09 Apr 2025

RARE: Retrieval-Augmented Reasoning Modeling

...

469

30 Mar 2025

Harmonia: A Multi-Agent Reinforcement Learning Approach to Data Placement and Migration in Hybrid Storage Systems

443

26 Mar 2025

Time After Time: Deep-Q Effect Estimation for Interventions on When and What to doInternational Conference on Learning Representations (ICLR), 2025

Yoav Wald

M. Goldstein

Yonathan Efroni

Wouter A. C. van Amsterdam

Rajesh Ranganath

CML

405

20 Mar 2025

Off-Policy Selection for Initiating Human-Centric Experimental DesignNeural Information Processing Systems (NeurIPS), 2024

345

26 Oct 2024

AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent DesignInternational Conference on Agents and Artificial Intelligence (ICAART), 2024

Francisco Erivaldo Fernandes Junior

Antti Oulasvirta

1.2K

25 Oct 2024

Experimental evaluation of offline reinforcement learning for HVAC control in buildings

214

15 Aug 2024

On the consistency of hyper-parameter selection in value-based deep reinforcement learning

J. Obando-Ceron

J. G. Araújo

Rameswar Panda

Pablo Samuel Castro

450

25 Jun 2024

Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models

463

30 May 2024

Hyperparameter Optimization Can Even be Harmful in Off-Policy Learning and How to Deal with It

Yuta Saito

Masahiro Nomura

OffRL

354

23 Apr 2024

Towards Diverse Behaviors: A Benchmark for Imitation Learning with Human Demonstrations

320

22 Feb 2024

Deep autoregressive density nets vs neural ensembles for model-based offline reinforcement learning

254

05 Feb 2024

Adversarially Trained Actor Critic for offline CMDPsNeural Information Processing Systems (NeurIPS), 2024

146

01 Jan 2024

When is Offline Policy Selection Sample Efficient for Reinforcement Learning?

Martha White

437

04 Dec 2023

Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy EvaluationInternational Conference on Learning Representations (ICLR), 2023

523

30 Nov 2023

SCOPE-RL: A Python Library for Offline Reinforcement Learning and Off-Policy Evaluation

548

30 Nov 2023

Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy OptimizationInternational Conference on Learning Representations (ICLR), 2023

433

06 Nov 2023

State-Action Similarity-Based Representations for Off-Policy EvaluationNeural Information Processing Systems (NeurIPS), 2023

Brahma S. Pavse

Josiah P. Hanna

OffRL

316

27 Oct 2023

Robustness of Algorithms for Causal Structure Learning to Hyperparameter ChoiceCLEaR (CLEaR), 2023

308

27 Oct 2023

Counterfactual-Augmented Importance Sampling for Semi-Offline Policy EvaluationNeural Information Processing Systems (NeurIPS), 2023

Shengpu Tang

Jenna Wiens

OffRL CML

304

26 Oct 2023

ORL-AUDITOR: Dataset Auditing in Offline Deep Reinforcement LearningNetwork and Distributed System Security Symposium (NDSS), 2023

361

06 Sep 2023

Active Policy Improvement from Multiple Black-box OraclesInternational Conference on Machine Learning (ICML), 2023

451

17 Jun 2023

$$\pi2\text{vec}$: Policy Representations with Successor Features$

\pi2\text{vec}

: Policy Representations with Successor FeaturesInternational Conference on Learning Representations (ICLR), 2023

282

16 Jun 2023

Stepsize Learning for Policy Gradient Methods in Contextual Markov Decision Processes

Luca Sabbioni

Francesco Corda

Marcello Restelli

221

13 Jun 2023

Explaining RL Decisions with TrajectoriesInternational Conference on Learning Representations (ICLR), 2023

265

06 May 2023

A Survey of Demonstration Learning

André Rosa de Sousa Porfírio Correia

Luís A. Alexandre

OffRL

279

20 Mar 2023

Scalable End-to-End ML Platforms: from AutoML to Self-serve

...

457

27 Feb 2023

Behavior Proximal Policy OptimizationInternational Conference on Learning Representations (ICLR), 2023

367

22 Feb 2023

Machine Learning Systems: A Survey from a Data-Oriented PerspectiveACM Computing Surveys (ACM Comput. Surv.), 2023

340

09 Feb 2023

A Strong Baseline for Batch Imitation Learning

185

06 Feb 2023

Revisiting Bellman Errors for Offline Model SelectionInternational Conference on Machine Learning (ICML), 2023

Joshua P. Zitovsky

Daniel de Marchi

Rishabh Agarwal

Michael R. Kosorok University of North Carolina at Chapel Hill

OffRL

345

31 Jan 2023

Model-based Offline Reinforcement Learning with Local MisspecificationAAAI Conference on Artificial Intelligence (AAAI), 2023

265

26 Jan 2023

Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State AbstractionAAAI Conference on Artificial Intelligence (AAAI), 2022

Brahma S. Pavse

Josiah P. Hanna

OffRL

228

14 Dec 2022

Benchmarking Offline Reinforcement Learning Algorithms for E-Commerce Order Fraud Evaluation

Soysal Degirmenci

Chris Jones

OffRL

161

05 Dec 2022

Policy-Adaptive Estimator Selection for Off-Policy EvaluationAAAI Conference on Artificial Intelligence (AAAI), 2022

300

25 Nov 2022

Oracle Inequalities for Model Selection in Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2022

392

03 Nov 2022

Beyond the Return: Off-policy Function Estimation under User-specified Error-measuring DistributionsNeural Information Processing Systems (NeurIPS), 2022

Audrey Huang

Nan Jiang

OffRL

218

27 Oct 2022

Data-Efficient Pipeline for Offline Reinforcement Learning with Limited DataNeural Information Processing Systems (NeurIPS), 2022

353

16 Oct 2022

AnalogVNN: A fully modular framework for modeling and optimizing photonic neural networksAPL Machine Learning (AML), 2022

Vivswan Shah

Nathan Youngblood

258

14 Oct 2022

Conservative Bayesian Model-Based Value Expansion for Offline Policy OptimizationInternational Conference on Learning Representations (ICLR), 2022

Baher Abdulhai

231

07 Oct 2022

Hierarchical reinforcement learning for in-hand robotic manipulation using Davenport chained rotationsInternational Conference on Automation, Robotics and Applications (ICARA), 2022

Francisco Roldan Sanchez

176

03 Oct 2022

Ensemble Reinforcement Learning in Continuous Spaces -- A Hierarchical Multi-Step Approach for Policy TrainingInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Gang Chen

Victoria Huang

OffRL

341

29 Sep 2022

Q-learning Decision Transformer: Leveraging Dynamic Programming for Conditional Sequence Modelling in Offline RLInternational Conference on Machine Learning (ICML), 2022

Taku Yamagata

Ahmed Khalil

Raúl Santos-Rodríguez

OffRL

690

121

08 Sep 2022

Discriminator-Weighted Offline Imitation Learning from Suboptimal DemonstrationsInternational Conference on Machine Learning (ICML), 2022

337

104

20 Jul 2022

An Empirical Study of Implicit Regularization in Deep Offline RL

367

05 Jul 2022

Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning

David Brandfonbrener

Rémi Tachet des Combes

Romain Laroche

OffRL

269

02 Jun 2022

Offline Policy Comparison with Confidence: Benchmarks and Baselines

293

22 May 2022