v1v2v3v4 (latest)

Reinforcement Learning in Healthcare: A Survey

ACM Computing Surveys (ACM CSUR), 2019

22 August 2019

Papers citing "Reinforcement Learning in Healthcare: A Survey"

50 / 262 papers shown

Exposing Vulnerabilities in RL: A Novel Stealthy Backdoor Attack through Reward Poisoning

185

27 Nov 2025

OpenApps: Simulating Environment Variations to Measure UI-Agent Reliability

151

25 Nov 2025

Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies

196

15 Nov 2025

Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression

162

15 Nov 2025

Diffusion Policies with Value-Conditional Optimization for Offline Reinforcement Learning

289

12 Nov 2025

Bernstein-von Mises for Adaptively Collected Data

Kevin Du

Yash Nair

Lucas Janson

143

10 Nov 2025

Directional-Clamp PPO

107

04 Nov 2025

Sample-efficient and Scalable Exploration in Continuous-Time RL

181

28 Oct 2025

Neural Index Policies for Restless Multi-Action Bandits with Heterogeneous Budgets

Himadri S. Pandey

Kai Wang

Gian-Gabriel P. Garcia

155

24 Oct 2025

Do You Trust the Process?: Modeling Institutional Trust for Community Adoption of Reinforcement Learning Policies

109

24 Oct 2025

Agentic Systems in Radiology: Design, Applications, Evaluation, and Challenges

...

321

10 Oct 2025

Hierarchical Spatial Algorithms for High-Resolution Image Quantization and Feature Extraction

Noor Islam S. Mohammad

09 Oct 2025

Pathology-CoT: Learning Visual Chain-of-Thought Agent from Expert Whole Slide Image Diagnosis Behavior

187

06 Oct 2025

Diffusion Policies with Offline and Inverse Reinforcement Learning for Promoting Physical Activity in Older Adults Using Wearable Sensors

173

22 Sep 2025

Incentivizing Safer Actions in Policy Optimization for Constrained Reinforcement LearningInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

S. Hazra

P. Dasgupta

Soumyajit Dey

148

11 Sep 2025

Using AI to Optimize Patient Transfer and Resource Utilization During Mass-Casualty Incidents: A Simulation Platform

10 Sep 2025

LLM-Driven Policy Diffusion: Enhancing Generalization in Offline Reinforcement Learning

Hanping Zhang

Yuhong Guo

OffRL

199

30 Aug 2025

Beyond Prediction: Reinforcement Learning as the Defining Leap in Healthcare AI

306

28 Aug 2025

Central Limit Theorems for Transition Probabilities of Controlled Markov Chains

220

02 Aug 2025

MOORL: A Framework for Integrating Offline-Online Reinforcement Learning

453

11 Jun 2025

How to Provably Improve Return Conditioned Supervised Learning?

236

10 Jun 2025

SAFER: A Calibrated Risk-Aware Multimodal Recommendation Model for Dynamic Treatment Regimes

126

07 Jun 2025

Accelerated Learning with Linear Temporal Logic using Differentiable Simulation

Alper Kamil Bozkurt

Calin Belta

Ming C. Lin

302

01 Jun 2025

Composite Flow Matching for Reinforcement Learning with Shifted-Dynamics Data

461

29 May 2025

Learning optimal treatment strategies for intraoperative hypotension using deep reinforcement learning

Esra Adiyeke

Tianqi Liu

Venkata Sai Dheeraj Naganaboina

...

519

27 May 2025

Multi-level Certified Defense Against Poisoning Attacks in Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

Benjamin I. P. Rubinstein

OffRL AAML

257

27 May 2025

medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support

415

26 May 2025

Counterfactual Explanations for Continuous Action Reinforcement LearningInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

383

19 May 2025

Multi-agent Embodied AI: Advances and Future Directions

603

08 May 2025

Active Sampling for MRI-based Sequential Decision Making

Yuning Du

Jingshuai Liu

R. Dharmakumar

Sotirios A. Tsaftaris

280

07 May 2025

Bridging Econometrics and AI: VaR Estimation via Reinforcement Learning and GARCH Models

269

23 Apr 2025

Can Machine Learning Agents Deal with Hard Choices?

Kangyu Wang

640

18 Apr 2025

How to Adapt Control Barrier Functions? A Learning-Based Approach with Applications to a VTOL QuadplaneIEEE Conference on Decision and Control (CDC), 2025

Taekyung Kim

Randal W. Beard

Dimitra Panagou

512

03 Apr 2025

Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation

252

26 Mar 2025

Latent Embedding Adaptation for Human Preference Alignment in Diffusion PlannersIEEE International Conference on Robotics and Automation (ICRA), 2025

417

24 Mar 2025

Zero-Shot Action Generalization with Limited ObservationsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

370

11 Mar 2025

A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications

Siyuan Mu

Sen Lin

MoE

1.4K

10 Mar 2025

Finite-Sample Analysis of Policy Evaluation for Robust Average Reward Reinforcement Learning

592

24 Feb 2025

Wasserstein Adaptive Value Estimation for Actor-Critic Reinforcement LearningConference on Learning for Dynamics & Control (L4DC), 2025

Ali Baheri

Zahra Sharooei

Chirayu Salgarkar

1.1K

17 Jan 2025

Methodology for Interpretable Reinforcement Learning for Optimizing Mechanical Ventilation

349

10 Jan 2025

Cognitive Kernel: An Open-source Agent System towards Generalist Autopilots

522

03 Jan 2025

Reinforcement Learning for a Discrete-Time Linear-Quadratic Control Problem with an Application

Lucky Li

237

08 Dec 2024

Towards Fast Safe Online Reinforcement Learning via Policy Finetuning

475

05 Dec 2024

Provably Efficient Action-Manipulation Attack Against Continuous Reinforcement Learning

281

20 Nov 2024

Upside-Down Reinforcement Learning for More Interpretable Optimal ControlInternational Conference on Agents and Artificial Intelligence (ICAART), 2024

Juan Cardenas-Cartagena

323

18 Nov 2024

An Investigation of Offline Reinforcement Learning in Factorisable Action Spaces

410

17 Nov 2024

Hypercube Policy Regularization Framework for Offline Reinforcement Learning

Yi Shen

Hanyan Huang

OffRL

276

07 Nov 2024

Uncertainty-based Offline Variational Bayesian Reinforcement Learning for Robustness under Diverse Data CorruptionsNeural Information Processing Systems (NeurIPS), 2024

451

01 Nov 2024

StepCountJITAI: simulation environment for RL with application to physical activity adaptive intervention

Karine Karine

Benjamin M. Marlin

222

01 Nov 2024

OCEAN: Offline Chain-of-thought Evaluation and Alignment in Large Language Models

Junda Wu

...

Xiang Chen

256

31 Oct 2024