v1v2v3v4v5v6 (latest)

MOPO: Model-based Offline Policy Optimization

Neural Information Processing Systems (NeurIPS), 2020

27 May 2020

ArXiv (abs)PDF HTML Github (179★)

Papers citing "MOPO: Model-based Offline Policy Optimization"

50 / 538 papers shown

Efficient Cross-Domain Offline Reinforcement Learning with Dynamics- and Value-Aligned Data Filtering

207

02 Dec 2025

Dual-Robust Cross-Domain Offline Reinforcement Learning Against Dynamics Shifts

227

02 Dec 2025

Efficient Diffusion Planning with Temporal Diffusion

219

26 Nov 2025

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

194

04 Nov 2025

Social World Model-Augmented Mechanism Design Policy Learning

174

22 Oct 2025

Using Non-Expert Data to Robustify Imitation Learning via Offline Reinforcement Learning

...

345

22 Oct 2025

Internalizing World Models via Self-Play Finetuning for Agentic RL

156

16 Oct 2025

Near-Optimal Second-Order Guarantees for Model-Based Adversarial Imitation Learning

261

10 Oct 2025

Analytical Survey of Learning with Low-Resource Data: From Analysis to Investigation

...

221

10 Oct 2025

Expressive Value Learning for Scalable Offline Reinforcement Learning

Nicolas Espinosa-Dice

Kianté Brantley

Wen Sun

OffRL

308

09 Oct 2025

Offline Reinforcement Learning in Large State Spaces: Algorithms and Guarantees

Nan Jiang

Tengyang Xie

OffRL

243

05 Oct 2025

RAMAC: Multimodal Risk-Aware Offline Reinforcement Learning and the Role of Behavior Regularization

219

03 Oct 2025

PASTA: A Unified Framework for Offline Assortment Learning

217

02 Oct 2025

SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer

426

23 Sep 2025

Enhancing Generative Auto-bidding with Offline Reward Evaluation and Policy Search

...

292

19 Sep 2025

Offline vs. Online Learning in Model-based RL: Lessons for Data Collection Strategies

155

06 Sep 2025

Beyond Prediction: Reinforcement Learning as the Defining Leap in Healthcare AI

341

28 Aug 2025

Adaptive Scaling of Policy Constraints for Offline Reinforcement Learning

171

27 Aug 2025

Dream to Chat: Model-based Reinforcement Learning on Dialogues with User Belief Modeling

297

23 Aug 2025

Central Limit Theorems for Transition Probabilities of Controlled Markov Chains

233

02 Aug 2025

Safe Deployment of Offline Reinforcement Learning via Input Convex Action Correction

Alex Durkin

Jasper Stolte

Matthew Jones

Raghuraman Pitchumani

285

30 Jul 2025

RAD: Retrieval High-quality Demonstrations to Enhance Decision-making

257

21 Jul 2025

Latent Policy Steering with Embodiment-Agnostic Pretrained World Models

Yiqi Wang

Mrinal Verghese

Jeff Schneider

341

17 Jul 2025

Q-Guided Stein Variational Model Predictive Control via RL-informed Policy Prior

232

09 Jul 2025

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

Ranting Hu

OffRL

329

18 Jun 2025

MOBODY: Model Based Off-Dynamics Offline Reinforcement Learning

312

10 Jun 2025

Accelerating Diffusion Planners in Offline RL via Reward-Aware Consistency Trajectory Distillation

385

09 Jun 2025

Horizon Reduction Makes RL Scalable

731

04 Jun 2025

Hybrid Cross-domain Robust Reinforcement Learning

275

29 May 2025

SOReL and TOReL: Two Methods for Fully Offline Reinforcement Learning

362

28 May 2025

Scaling Offline RL via Efficient and Expressive Shortcut Models

Nicolas Espinosa-Dice

290

28 May 2025

Decision Flow Policy Optimization

389

26 May 2025

medDreamer: Model-Based Reinforcement Learning with Latent Imagination on Complex EHRs for Clinical Decision Support

429

26 May 2025

FlowQ: Energy-Guided Flow Policies for Offline Reinforcement Learning

Marvin Alles

Nutan Chen

Patrick van der Smagt

Botond Cseke

464

20 May 2025

Imagination-Limited Q-Learning for Offline Reinforcement LearningInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

375

18 May 2025

ImagineBench: Evaluating Reinforcement Learning with Large Language Model Rollouts

OffRL LLMAG LM&Ro LRM

287

15 May 2025

Beyond the Known: Decision Making with Counterfactual Reasoning Decision TransformerInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

Minh Hoang Nguyen

Linh Le Pham Van

Thommen George Karimpanal

Sunil Gupta

Hung Le

OffRL LRM

335

14 May 2025

DARLR: Dual-Agent Offline Reinforcement Learning for Recommender Systems with Dynamic RewardAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

312

12 May 2025

Taming OOD Actions for Offline Reinforcement Learning: An Advantage-Based Approach

582

08 May 2025

Coupled Distributional Random Expert Distillation for World Model Online Imitation Learning

Shangzhe Li

Zhiao Huang

Hao Su

473

04 May 2025

PIN-WM: Learning Physics-INformed World Models for Non-Prehensile Manipulation

514

23 Apr 2025

Improving Sequential Recommenders through Counterfactual Augmentation of System ExposureAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

366

18 Apr 2025

An Optimal Discriminator Weighted Imitation Perspective for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

478

17 Apr 2025

VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning

613

16 Apr 2025

A Clean Slate for Offline Reinforcement Learning

497

15 Apr 2025

Offline Reinforcement Learning using Human-Aligned Reward Labeling for Autonomous Emergency Braking in Occluded Pedestrian Crossing

Vinal Asodia

Zhenhua Feng

Saber Fallah

Zhenhua Feng

Saber Fallah

OffRL

351

11 Apr 2025

Learning with Imperfect Models: When Multi-step Prediction Mitigates Compounding Error

238

02 Apr 2025

Beyond Non-Expert Demonstrations: Outcome-Driven Action Constraint for Offline Reinforcement Learning

425

02 Apr 2025

A Survey of Reinforcement Learning-Based Motion Planning for Autonomous Driving: Lessons Learned from a Driving Task Perspective

...

285

31 Mar 2025

Model-Based Offline Reinforcement Learning with Adversarial Data Augmentation

286

26 Mar 2025