Offline Reinforcement Learning with Fisher Divergence Critic Regularization

International Conference on Machine Learning (ICML), 2021

14 March 2021

Papers citing "Offline Reinforcement Learning with Fisher Divergence Critic Regularization"

50 / 209 papers shown

Diffusion Policies with Value-Conditional Optimization for Offline Reinforcement Learning

294

12 Nov 2025

Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning

185

04 Nov 2025

Towards Robust Zero-Shot Reinforcement Learning

403

17 Oct 2025

Adversarial Fine-tuning in Offline-to-Online Reinforcement Learning for Robust Robot Control

363

15 Oct 2025

AOAD-MAT: Transformer-based multi-agent deep reinforcement learning model considering agents' order of action decisions

Shota Takayama

Katsuhide Fujita

150

15 Oct 2025

Expert or not? assessing data quality in offline reinforcement learning

156

14 Oct 2025

Robust Policy Expansion for Offline-to-Online RL under Diverse Data Corruption

379

29 Sep 2025

Wavelet Fourier Diffuser: Frequency-Aware Diffusion Model for Reinforcement Learning

Yifu Luo

Yongzhe Chang

Xueqian Wang

188

04 Sep 2025

Offline-to-Online Reinforcement Learning with Classifier-Free Diffusion Generation

265

09 Aug 2025

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

286

20 Jun 2025

Offline RL with Smooth OOD Generalization in Convex Hull and its NeighborhoodInternational Conference on Learning Representations (ICLR), 2025

249

10 Jun 2025

Learning to Trust Bellman Updates: Selective State-Adaptive Regularization for Offline RL

233

26 May 2025

Planning without Search: Refining Frontier LLMs with Offline Goal-Conditioned RL

555

23 May 2025

Beyond the Known: Decision Making with Counterfactual Reasoning Decision TransformerInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

Minh Hoang Nguyen

Linh Le Pham Van

Thommen George Karimpanal

Sunil Gupta

Hung Le

OffRL LRM

312

14 May 2025

Generative Auto-Bidding with Value-Guided ExplorationsAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

Peng Jiang

...

531

20 Apr 2025

Improving Sequential Recommenders through Counterfactual Augmentation of System ExposureAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

350

18 Apr 2025

An Optimal Discriminator Weighted Imitation Perspective for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2025

455

17 Apr 2025

Decision SpikeFormer: Spike-Driven Transformer for Decision MakingComputer Vision and Pattern Recognition (CVPR), 2025

267

04 Apr 2025

Policy Constraint by Only Support Constraint for Offline Reinforcement Learning

251

07 Mar 2025

Eau De

Q

-Network: Adaptive Distillation of Neural Networks in Deep Reinforcement Learning

333

03 Mar 2025

Behavior Preference Regression for Offline Reinforcement Learning

Padmanaba Srinivasan

William J. Knottenbelt

OffRL

241

02 Mar 2025

B3C: A Minimalist Approach to Offline Multi-Agent Reinforcement Learning

Woojun Kim

Katia Sycara

OffRL

450

30 Jan 2025

Temporal Logic Specification-Conditioned Decision Transformer for Offline Safe Reinforcement LearningInternational Conference on Machine Learning (ICML), 2024

391

28 Jan 2025

Deterministic Uncertainty Propagation for Improved Model-Based Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

755

17 Jan 2025

LEASE: Offline Preference-based Reinforcement Learning with High Sample Efficiency

397

30 Dec 2024

ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2024

496

22 Dec 2024

An Investigation of Offline Reinforcement Learning in Factorisable Action Spaces

414

17 Nov 2024

A Non-Monolithic Policy Approach of Offline-to-Online Reinforcement Learning

254

31 Oct 2024

NetworkGym: Reinforcement Learning Environments for Multi-Access Traffic Management in Network SimulationNeural Information Processing Systems (NeurIPS), 2024

Yu-Xiang Wang

218

30 Oct 2024

Offline Reinforcement Learning with OOD State Correction and OOD Action SuppressionNeural Information Processing Systems (NeurIPS), 2024

646

25 Oct 2024

Choices are More Important than Efforts: LLM Enables Efficient Multi-Agent Exploration

Chang Liu

399

03 Oct 2024

ComaDICE: Offline Cooperative Multi-Agent Reinforcement Learning with Stationary Distribution Shift RegularizationInternational Conference on Learning Representations (ICLR), 2024

The Viet Bui

Thanh Hong Nguyen

Tien Mai

OffRL

432

02 Oct 2024

Surgical Task Automation Using Actor-Critic Frameworks and Self-Supervised Imitation Learning

Sotirios A. Tsaftaris

475

04 Sep 2024

Unsupervised-to-Online Reinforcement Learning

Junsu Kim

Seohong Park

Sergey Levine

OnRL

295

27 Aug 2024

Enhancing Reinforcement Learning Through Guided SearchEuropean Conference on Artificial Intelligence (ECAI), 2024

403

19 Aug 2024

SelfBC: Self Behavior Cloning for Offline Reinforcement LearningEuropean Conference on Artificial Intelligence (ECAI), 2024

316

04 Aug 2024

Diffusion Models as Optimizers for Efficient Planning in Offline RL

Peng Wang

339

23 Jul 2024

OASIS: Conditional Distribution Shaping for Offline Safe Reinforcement Learning

Tingnan Zhang

Wenhao Yu

Ding Zhao

OffRL OnRL

297

19 Jul 2024

Aligning Diffusion Behaviors with Q-functions for Efficient Continuous Control

Huayu Chen

Kaiwen Zheng

Hang Su

Jun Zhu

390

12 Jul 2024

ROER: Regularized Optimal Experience Replay

237

04 Jul 2024

ECLIPSE: Expunging Clean-label Indiscriminate Poisons via Sparse Diffusion Purification

Xianlong Wang

Shengshan Hu

Yechao Zhang

Ziqi Zhou

Leo Yu Zhang

Peng Xu

Wei Wan

Hai Jin

AAML

409

21 Jun 2024

Urban-Focused Multi-Task Offline Reinforcement Learning with Contrastive Data Sharing

Yanhua Li

221

20 Jun 2024

DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning

247

13 Jun 2024

Integrating Domain Knowledge for handling Limited Data in Offline RL

253

11 Jun 2024

Strategically Conservative Q-Learning

Yutaka Shimizu

Joey Hong

Sergey Levine

Masayoshi Tomizuka

OffRL OnRL

291

06 Jun 2024

UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning

Rui Yu

306

05 Jun 2024

Adaptive Advantage-Guided Policy Regularization for Offline Reinforcement Learning

Wei Pan

403

30 May 2024

AlignIQL: Policy Alignment in Implicit Q-Learning through Constrained Optimization

Longxiang He

Li Shen

Xueqian Wang

355

28 May 2024

Federated Offline Policy Optimization with Dual Regularization

355

24 May 2024

State-Constrained Offline Reinforcement Learning

407

23 May 2024