v1v2 (latest)

Confidence-Conditioned Value Functions for Offline Reinforcement Learning

International Conference on Learning Representations (ICLR), 2022

8 December 2022

Papers citing "Confidence-Conditioned Value Functions for Offline Reinforcement Learning"

17 / 17 papers shown

Reinforcement Learning Gradients as Vitamin for Online Finetuning Decision TransformersNeural Information Processing Systems (NeurIPS), 2024

250

31 Oct 2024

An Offline Adaptation Framework for Constrained Multi-Objective Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

340

16 Sep 2024

Preference-Optimized Pareto Set Learning for Blackbox Optimization

Zhang Haishan

Chen Liang

Koji Tsuda

247

19 Aug 2024

Out-of-Distribution Adaptation in Offline RL: Counterfactual Reasoning via Causal Normalizing Flows

210

06 May 2024

Grid-Mapping Pseudo-Count Constraint for Offline Reinforcement Learning

Yi Shen

Hanyan Huang

Shan Xie

225

03 Apr 2024

A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware PerspectiveNeural Information Processing Systems (NeurIPS), 2024

469

12 Mar 2024

Exploration and Anti-Exploration with Distributional Random Network Distillation

474

18 Jan 2024

Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy OptimizationInternational Conference on Learning Representations (ICLR), 2023

395

06 Nov 2023

Train Once, Get a Family: State-Adaptive Balances for Offline-to-Online Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

Gao Huang

361

27 Oct 2023

Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias

319

12 Oct 2023

Improving Offline-to-Online Reinforcement Learning with Q Conditioned State Entropy Exploration

382

07 Oct 2023

Learning Control Policies for Variable Objectives from Offline DataIEEE Symposium Series on Computational Intelligence (IEEE-SSCI), 2023

228

11 Aug 2023

Model-based Offline Reinforcement Learning with Count-based ConservatismInternational Conference on Machine Learning (ICML), 2023

Byeongchang Kim

Min Hwan Oh

OffRL

220

21 Jul 2023

Budgeting Counterfactual for Offline RLNeural Information Processing Systems (NeurIPS), 2023

309

12 Jul 2023

Automatic Trade-off Adaptation in Offline RLThe European Symposium on Artificial Neural Networks (ESANN), 2023

153

16 Jun 2023

PROTO: Iterative Policy Regularized Offline-to-Online Reinforcement Learning

304

25 May 2023

Anti-Exploration by Random Network DistillationInternational Conference on Machine Learning (ICML), 2023

268

31 Jan 2023