Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings

23 July 2021

Papers citing "Model Selection for Offline Reinforcement Learning: Practical Considerations for Healthcare Settings"

50 / 51 papers shown

Title
Q-function Decomposition with Intervention Semantics with Factored Action Spaces Junkyu Lee Tian Gao Elliot Nelson Miao Liu D. Bhattacharjya Songtao Lu OffRL 45 0 0 30 Apr 2025
Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation Hongye Cao Fan Feng Jing Huo Shangdong Yang Meng Fang Tianpei Yang Yang Gao AAML OffRL 58 0 0 26 Mar 2025
Policy Constraint by Only Support Constraint for Offline Reinforcement Learning Yunkai Gao Jiaming Guo Fan Wu Rui Zhang OffRL 54 0 0 07 Mar 2025
Dual Alignment Maximin Optimization for Offline Model-based RL Chi Zhou Wang Luo Haoran Li Congying Han Tiande Guo Zicheng Zhang OffRL 64 0 0 02 Feb 2025
Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data Corruptions Rui Yang Jie Wang Guoping Wu B. Li AAML OffRL 31 1 0 01 Nov 2024
Off-Policy Selection for Initiating Human-Centric Experimental Design Ge Gao Xi Yang Qitong Gao Song Ju Miroslav Pajic Min Chi OffRL 31 0 0 26 Oct 2024
Random Policy Enables In-Context Reinforcement Learning within Trust Horizons Weiqin Chen Santiago Paternain OffRL 37 0 0 25 Oct 2024
Abstract Reward Processes: Leveraging State Abstraction for Consistent Off-Policy Evaluation Shreyas Chaudhari A. Deshpande Bruno Castro da Silva Philip S. Thomas OffRL 32 1 0 03 Oct 2024
COSBO: Conservative Offline Simulation-Based Policy Optimization E. Kargar Ville Kyrki OffRL 18 0 0 22 Sep 2024
Empowering Clinicians with Medical Decision Transformers: A Framework for Sepsis Treatment A. Rahman Pranav Agarwal R. Noumeir P. Jouvet Vincent Michalski Samira Ebrahimi Kahou OffRL 24 0 0 28 Jul 2024
BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning Hao-ming Lin Wenhao Ding Jian Chen Laixi Shi Jiacheng Zhu Bo-wen Li Ding Zhao OffRL CML 44 0 0 15 Jul 2024
Preference Elicitation for Offline Reinforcement Learning Alizée Pace Bernhard Schölkopf Gunnar Rätsch Giorgia Ramponi OffRL 61 1 0 26 Jun 2024
DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime Zhiyao Luo Mingcheng Zhu Fenglin Liu Jiali Li Yangchen Pan Jiandong Zhou Tingting Zhu OffRL 20 3 0 28 May 2024
Reinforcement Learning in Dynamic Treatment Regimes Needs Critical Reexamination Zhiyao Luo Yangchen Pan Peter Watkinson Tingting Zhu OffRL 25 0 0 28 May 2024
State-Constrained Offline Reinforcement Learning Charles A. Hepburn Yue Jin Giovanni Montana OffRL 31 0 0 23 May 2024
Offline Reinforcement Learning with Behavioral Supervisor Tuning Padmanaba Srinivasan William J. Knottenbelt OffRL 27 1 0 25 Apr 2024
Hyperparameter Optimization Can Even be Harmful in Off-Policy Learning and How to Deal with It Yuta Saito Masahiro Nomura OffRL 28 2 0 23 Apr 2024
Offline Trajectory Generalization for Offline Reinforcement Learning Ziqi Zhao Zhaochun Ren Liu Yang Fajie Yuan Pengjie Ren Zhumin Chen Jun Ma Xin Xin OffRL 16 1 0 16 Apr 2024
Reusing Historical Trajectories in Natural Policy Gradient via Importance Sampling: Convergence and Convergence Rate Yifan Lin Yuhao Wang Enlu Zhou 51 0 0 01 Mar 2024
The Edge-of-Reach Problem in Offline Model-Based Reinforcement Learning Anya Sims Cong Lu Yee Whye Teh OffRL 22 3 0 19 Feb 2024
ODICE: Revealing the Mystery of Distribution Correction Estimation via Orthogonal-gradient Update Liyuan Mao Haoran Xu Weinan Zhang Xianyuan Zhan 27 10 0 01 Feb 2024
When is Offline Policy Selection Sample Efficient for Reinforcement Learning? Vincent Liu P. Nagarajan Andrew Patterson Martha White OffRL 13 1 0 04 Dec 2023
Towards Assessing and Benchmarking Risk-Return Tradeoff of Off-Policy Evaluation Haruka Kiyohara Ren Kishimoto K. Kawakami Ken Kobayashi Kazuhide Nakata Yuta Saito OffRL 25 9 0 30 Nov 2023
Counterfactual-Augmented Importance Sampling for Semi-Offline Policy Evaluation Shengpu Tang Jenna Wiens OffRL CML 8 4 0 26 Oct 2023
Off-Policy Evaluation for Human Feedback Qitong Gao Ge Gao Juncheng Dong Vahid Tarokh Min Chi Miroslav Pajic OffRL 21 5 0 11 Oct 2023
Offline Reinforcement Learning with Imbalanced Datasets Li Jiang Sijie Cheng Jielin Qiu Haoran Xu Wai Kin Victor Chan Zhao Ding OffRL 29 3 0 06 Jul 2023
Provably Efficient Offline Reinforcement Learning with Perturbed Data Sources Chengshuai Shi Wei Xiong Cong Shen Jing Yang OffRL 30 3 0 14 Jun 2023
Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care Ali Shirali Alexander Schubert Ahmed Alaa OffRL 16 3 0 13 Jun 2023
A Primal-Dual-Critic Algorithm for Offline Constrained Reinforcement Learning Kihyuk Hong Yuhang Li Ambuj Tewari OffRL 18 7 0 13 Jun 2023
Robust Reinforcement Learning through Efficient Adversarial Herding Juncheng Dong Hao-Lun Hsu Qitong Gao Vahid Tarokh Miroslav Pajic 21 4 0 12 Jun 2023
High-probability sample complexities for policy evaluation with linear function approximation Gen Li Weichen Wu Yuejie Chi Cong Ma Alessandro Rinaldo Yuting Wei OffRL 23 6 0 30 May 2023
Leveraging Factored Action Spaces for Efficient Offline Reinforcement Learning in Healthcare Shengpu Tang Maggie Makar Michael Sjoding Finale Doshi-Velez Jenna Wiens OffRL 48 37 0 02 May 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 36 71 0 28 Mar 2023
Towards Real-World Applications of Personalized Anesthesia Using Policy Constraint Q Learning for Propofol Infusion Control Xiuding Cai Jiao Chen Yaoyao Zhu Beiming Wang Yu Yao OffRL 32 5 0 17 Mar 2023
Revisiting Bellman Errors for Offline Model Selection Joshua P. Zitovsky Daniel de Marchi Rishabh Agarwal Michael R. Kosorok University of North Carolina at Chapel Hill OffRL 27 5 0 31 Jan 2023
Variational Latent Branching Model for Off-Policy Evaluation Qitong Gao Ge Gao Min Chi Miroslav Pajic OffRL 26 6 0 28 Jan 2023
Policy-Adaptive Estimator Selection for Off-Policy Evaluation Takuma Udagawa Haruka Kiyohara Yusuke Narita Yuta Saito Keisuke Tateno OffRL 25 22 0 25 Nov 2022
Oracle Inequalities for Model Selection in Offline Reinforcement Learning Jonathan Lee George Tucker Ofir Nachum Bo Dai Emma Brunskill OffRL 16 12 0 03 Nov 2022
Inference and Denoise: Causal Inference-based Neural Speech Enhancement Tsun-An Hsieh Chao-Han Huck Yang Pin-Yu Chen Sabato Marco Siniscalchi Yu Tsao CML 50 2 0 02 Nov 2022
Data-Efficient Pipeline for Offline Reinforcement Learning with Limited Data Allen Nie Yannis Flet-Berliac Deon R. Jordan William Steenbergen Emma Brunskill OffRL 15 12 0 16 Oct 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 26 61 0 15 Oct 2022
Towards Safe Mechanical Ventilation Treatment Using Deep Offline Reinforcement Learning Flemming Kondrup Thomas Jiralerspong Elaine Lau Nathan de Lara Jacob Shkrob My Duc Tran Doina Precup Sumana Basu OffRL 53 23 0 05 Oct 2022
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation Xiaoteng Ma Zhipeng Liang Jose H. Blanchet MingWen Liu Li Xia Jiheng Zhang Qianchuan Zhao Zhengyuan Zhou OOD OffRL 28 22 0 14 Sep 2022
Discriminator-Weighted Offline Imitation Learning from Suboptimal Demonstrations Haoran Xu Xianyuan Zhan Honglei Yin Huiling Qin OffRL 24 65 0 20 Jul 2022
Offline Policy Comparison with Confidence: Benchmarks and Baselines Anurag Koul Mariano Phielipp Alan Fern OffRL 15 0 0 22 May 2022
Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes Harry Emerson Matt Guy Ryan McConville OffRL 24 46 0 07 Apr 2022
Reinforcement Learning in Practice: Opportunities and Challenges Yuxi Li OffRL 34 9 0 23 Feb 2022
Why Should I Trust You, Bellman? The Bellman Error is a Poor Replacement for Value Error Scott Fujimoto D. Meger Doina Precup Ofir Nachum S. Gu 22 31 0 28 Jan 2022
Model Selection in Batch Policy Optimization Jonathan Lee George Tucker Ofir Nachum Bo Dai OffRL 19 12 0 23 Dec 2021
Pessimistic Model Selection for Offline Deep Reinforcement Learning Chao-Han Huck Yang Zhengling Qi Yifan Cui Pin-Yu Chen OffRL 16 4 0 29 Nov 2021