Towards Hyperparameter-free Policy Selection for Offline Reinforcement Learning

26 October 2021

Papers citing "Towards Hyperparameter-free Policy Selection for Offline Reinforcement Learning"

28 / 28 papers shown

Title
Model Selection for Off-policy Evaluation: New Algorithms and Experimental Protocol Pai Liu Lingfeng Zhao Shivangi Agarwal Jinghan Liu Audrey Huang P. Amortila Nan Jiang OODD OffRL 101 0 0 11 Feb 2025
Off-Policy Selection for Initiating Human-Centric Experimental Design Ge Gao Xi Yang Qitong Gao Song Ju Miroslav Pajic Min Chi OffRL 36 0 0 26 Oct 2024
OPERA: Automatic Offline Policy Evaluation with Re-weighted Aggregates of Multiple Estimators Allen Nie Yash Chandak Christina J. Yuan Anirudhan Badrinath Yannis Flet-Berliac Emma Brunskil OffRL 50 0 0 27 May 2024
When is Offline Policy Selection Sample Efficient for Reinforcement Learning? Vincent Liu P. Nagarajan Andrew Patterson Martha White OffRL 26 2 0 04 Dec 2023
Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy Evaluation Haruka Kiyohara Ren Kishimoto K. Kawakami Ken Kobayashi Kazuhide Nakata Yuta Saito OffRL 29 9 0 30 Nov 2023
SCOPE-RL: A Python Library for Offline Reinforcement Learning and Off-Policy Evaluation Haruka Kiyohara Ren Kishimoto K. Kawakami Ken Kobayashi Kazuhide Nakata Yuta Saito OffRL ELM 37 4 0 30 Nov 2023
Waypoint Transformer: Reinforcement Learning via Supervised Learning with Intermediate Targets Anirudhan Badrinath Yannis Flet-Berliac Allen Nie Emma Brunskill OffRL 27 16 0 24 Jun 2023
Hyperparameters in Reinforcement Learning and How To Tune Them Theresa Eimer Marius Lindauer Roberta Raileanu OffRL 29 34 0 02 Jun 2023
OER: Offline Experience Replay for Continual Offline Reinforcement Learning Sibo Gai Donglin Wang Li He CLL OffRL 45 3 0 23 May 2023
Behavior Proximal Policy Optimization Zifeng Zhuang Kun Lei Jinxin Liu Donglin Wang Yilang Guo OffRL 30 34 0 22 Feb 2023
Revisiting Bellman Errors for Offline Model Selection Joshua P. Zitovsky Daniel de Marchi Rishabh Agarwal Michael R. Kosorok University of North Carolina at Chapel Hill OffRL 27 5 0 31 Jan 2023
Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design Shuze Liu Shangtong Zhang OffRL 30 3 0 31 Jan 2023
Policy-Adaptive Estimator Selection for Off-Policy Evaluation Takuma Udagawa Haruka Kiyohara Yusuke Narita Yuta Saito Keisuke Tateno OffRL 27 23 0 25 Nov 2022
Oracle Inequalities for Model Selection in Offline Reinforcement Learning Jonathan Lee George Tucker Ofir Nachum Bo Dai Emma Brunskill OffRL 24 13 0 03 Nov 2022
Beyond the Return: Off-policy Function Estimation under User-specified Error-measuring Distributions Audrey Huang Nan Jiang OffRL 51 9 0 27 Oct 2022
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data Allen Nie Yannis Flet-Berliac Deon R. Jordan William Steenbergen Emma Brunskill OffRL 28 12 0 16 Oct 2022
VIP: Towards Universal Visual Reward and Representation via Value-Implicit Pre-Training Yecheng Jason Ma Shagun Sodhani Dinesh Jayaraman Osbert Bastani Vikash Kumar Amy Zhang SSL OffRL 33 284 0 30 Sep 2022
Robust Reinforcement Learning using Offline Data Kishan Panaganti Zaiyan Xu D. Kalathil Mohammad Ghavamzadeh OffRL 37 66 0 10 Aug 2022
How Far I'll Go: Offline Goal-Conditioned Reinforcement Learning via $f$ -Advantage Regression Yecheng Jason Ma Jason Yan Dinesh Jayaraman Osbert Bastani OffRL 23 51 0 07 Jun 2022
Incorporating Explicit Uncertainty Estimates into Deep Offline Reinforcement Learning David Brandfonbrener Rémi Tachet des Combes Romain Laroche OffRL 37 5 0 02 Jun 2022
Reinforcement Learning in Practice: Opportunities and Challenges Yuxi Li OffRL 36 9 0 23 Feb 2022
Adversarially Trained Actor Critic for Offline Reinforcement Learning Ching-An Cheng Tengyang Xie Nan Jiang Alekh Agarwal OffRL 11 125 0 05 Feb 2022
Don't Change the Algorithm, Change the Data: Exploratory Data for Offline Reinforcement Learning Denis Yarats David Brandfonbrener Hao Liu Michael Laskin Pieter Abbeel A. Lazaric Lerrel Pinto OffRL OnRL 21 84 0 31 Jan 2022
Hyperparameter Selection Methods for Fitted Q-Evaluation with Error Guarantee Kohei Miyaguchi OffRL 38 1 0 07 Jan 2022
Model Selection in Batch Policy Optimization Jonathan Lee George Tucker Ofir Nachum Bo Dai OffRL 19 12 0 23 Dec 2021
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning Vincent Liu James Wright Martha White OffRL 31 1 0 15 Nov 2021
An Offline Risk-aware Policy Selection Method for Bayesian Markov Decision Processes Giorgio Angelotti Nicolas Drougard Caroline Ponzoni Carvalho Chanel OffRL 21 0 0 27 May 2021
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020