v1v2v3 (latest)

Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems

4 May 2020

Papers citing "Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems"

50 / 1,433 papers shown

Efficient Cross-Domain Offline Reinforcement Learning with Dynamics- and Value-Aligned Data Filtering

207

02 Dec 2025

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

227

02 Dec 2025

FOVA: Offline Federated Reinforcement Learning with Mixed-Quality Data

163

02 Dec 2025

Forecasting in Offline Reinforcement Learning for Non-stationary Environments

261

01 Dec 2025

Outcome-Aware Spectral Feature Learning for Instrumental Variable Regression

146

30 Nov 2025

Algorithmic Guarantees for Distilling Supervised and Offline RL Datasets

280

29 Nov 2025

BAMAS: Structuring Budget-Aware Multi-Agent Systems

412

26 Nov 2025

SOMBRL: Scalable and Optimistic Model-Based RL

318

25 Nov 2025

A Comparison Between Decision Transformers and Traditional Offline Reinforcement Learning Algorithms

Ali Murtaza Caunhye

Asad Jeewa

189

20 Nov 2025

$$π^{*}_{0.6}$: a VLA That Learns From Experience$

π^{*}_{0.6}

: a VLA That Learns From Experience

Physical Intelligence

...

1.3K

100

18 Nov 2025

Soft Conflict-Resolution Decision Transformer for Offline Multi-Task Reinforcement Learning

161

17 Nov 2025

Integrating Neural Differential Forecasting with Safe Reinforcement Learning for Blood Glucose Regulation

16 Nov 2025

Quantile Q-Learning: Revisiting Offline Extreme Q-Learning with Quantile Regression

164

15 Nov 2025

Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies

205

15 Nov 2025

PROF: An LLM-based Reward Code Preference Optimization Framework for Offline Imitation Learning

388

14 Nov 2025

Enhancing Robustness of Offline Reinforcement Learning Under Data Corruption via Sharpness-Aware Minimization

Le Xu

Jiayu Chen

AAML

119

14 Nov 2025

Diffusion Policies with Value-Conditional Optimization for Offline Reinforcement Learning

297

12 Nov 2025

Multi-agent Coordination via Flow Matching

Dongsu Lee

Daehee Lee

Amy Zhang

191

07 Nov 2025

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

194

04 Nov 2025

Closing the Expression Gap in LLM Instructions via Socratic Questioning

239

31 Oct 2025

Data-Efficient RLVR via Off-Policy Influence Guidance

...

206

30 Oct 2025

Self-Improving Vision-Language-Action Models with Data Generation via Residual RL

...

694

30 Oct 2025

Offline Clustering of Preference Learning with Active-data Augmentation

280

30 Oct 2025

ZTRS: Zero-Imitation End-to-end Autonomous Driving with Trajectory Scoring

...

207

28 Oct 2025

Mixed-Density Diffuser: Efficient Planning with Non-Uniform Temporal Resolution

Crimson Stambaugh

Rajesh P. N. Rao

DiffM

288

27 Oct 2025

Human-Like Goalkeeping in a Realistic Football Simulation: a Sample-Efficient Reinforcement Learning Approach

Alessandro Sestini

Joakim Bergdahl

Jean-Philippe Barrette-LaPierre

210

27 Oct 2025

Transitive RL: Value Learning via Divide and Conquer

170

26 Oct 2025

Reducing the Probability of Undesirable Outputs in Language Models Using Probabilistic Inference

130

24 Oct 2025

Confounding Robust Deep Reinforcement Learning: A Causal Approach

245

24 Oct 2025

Online Optimization for Offline Safe Reinforcement Learning

179

24 Oct 2025

Using Non-Expert Data to Robustify Imitation Learning via Offline Reinforcement Learning

...

345

22 Oct 2025

Implicit State Estimation via Video Replanning

174

20 Oct 2025

Finite-Time Bounds for Average-Reward Fitted Q-Iteration

Jongmin Lee

Ernest K. Ryu

OffRL

137

20 Oct 2025

OffSim: Offline Simulator for Model-based Offline Inverse Reinforcement Learning

154

17 Oct 2025

RM-RL: Role-Model Reinforcement Learning for Precise Robot Manipulation

233

16 Oct 2025

Reinforcement Learning Meets Masked Generative Models: Mask-GRPO for Text-to-Image Generation

195

15 Oct 2025

Beyond Static LLM Policies: Imitation-Enhanced Reinforcement Learning for Recommendation

159

15 Oct 2025

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

371

15 Oct 2025

Expert or not? assessing data quality in offline reinforcement learning

160

14 Oct 2025

FOSSIL: Harnessing Feedback on Suboptimal Samples for Data-Efficient Generalisation with Imitation Learning for Embodied Vision-and-Language Tasks

171

13 Oct 2025

Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems: A Structured Review

Kumater Ter

Ore-Ofe Ajayi

Daniel Udekwe

341

11 Oct 2025

Scalable Offline Metrics for Autonomous Driving

273

09 Oct 2025

DEAS: DEtached value learning with Action Sequence for Scalable Offline RL

179

09 Oct 2025

Energy-Guided Diffusion Sampling for Long-Term User Behavior Prediction in Reinforcement Learning-based Recommendation

143

09 Oct 2025

Expressive Value Learning for Scalable Offline Reinforcement Learning

Nicolas Espinosa-Dice

Kianté Brantley

Wen Sun

OffRL

308

09 Oct 2025

Maximum In-Support Return Modeling for Dynamic Recommendation with Language Model Prior

139

09 Oct 2025

Hierarchical Spatial Algorithms for High-Resolution Image Quantization and Feature Extraction

Noor Islam S. Mohammad

09 Oct 2025

TS-Agent: Understanding and Reasoning Over Raw Time Series via Iterative Insight Gathering

Vamsi K. Potluru

Manuela Veloso

AI4TS AIFin LRM

277

08 Oct 2025

Dual Goal Representations

S. Park

Deepinder Mann

Sergey Levine

269

08 Oct 2025

A Case for Leveraging Generative AI to Expand and Enhance Training in the Provision of Mental Health Services

Hannah R. Lawrence

Shannon Wiltsey Stirman

202

08 Oct 2025