Optimistic Exploration even with a Pessimistic Initialisation

International Conference on Learning Representations (ICLR), 2020

26 February 2020

Papers citing "Optimistic Exploration even with a Pessimistic Initialisation"

27 / 27 papers shown

Count Counts: Motivating Exploration in LLM Reasoning with Count-based Intrinsic Rewards

262

18 Oct 2025

Universal Value-Function Uncertainties

Moritz A. Zanger

Max Weltevrede

Yaniv Oren

Pascal R. van der Vaart

337

27 May 2025

Exploration by Random Distribution Distillation

385

16 May 2025

Synthesis of Model Predictive Control and Reinforcement Learning: Survey and Classification

419

04 Feb 2025

Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-Constraint

Wei Xiong

Tong Zhang

504

332

18 Dec 2023

Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias

342

12 Oct 2023

Flipping Coins to Estimate Pseudocounts for Exploration in Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Sam Lobel

Akhil Bagaria

George Konidaris

282

05 Jun 2023

Posterior Sampling for Deep Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Remo Sasso

Michelangelo Conserva

Paulo E. Rauber

OffRL BDL

295

30 Apr 2023

Conditionally Optimistic Exploration for Cooperative Deep Multi-Agent Reinforcement LearningConference on Uncertainty in Artificial Intelligence (UAI), 2023

Janarthanan Rajendran

332

16 Mar 2023

Pretraining in Deep Reinforcement Learning: A Survey

Shuai Li

286

08 Nov 2022

Optimal Conservative Offline RL with General Function Approximation via Augmented LagrangianInternational Conference on Learning Representations (ICLR), 2022

475

01 Nov 2022

Optimistic Curiosity Exploration and Conservative Exploitation with Linear Reward Shaping

231

15 Sep 2022

Slowly Changing Adversarial Bandit Algorithms are Efficient for Discounted MDPsInternational Conference on Algorithmic Learning Theory (ALT), 2022

Ian A. Kash

L. Reyzin

Zishun Yu

476

18 May 2022

Learning to Act with Affordance-Aware Multimodal Neural SLAMIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2022

Govind Thattai

317

24 Jan 2022

Dealing with the Unknown: Pessimistic Offline Reinforcement LearningConference on Robot Learning (CoRL), 2021

Jinning Li

Chen Tang

Masayoshi Tomizuka

Wei Zhan

OffRL

305

09 Nov 2021

Dynamic Bottleneck for Robust Self-Supervised ExplorationNeural Information Processing Systems (NeurIPS), 2021

Jianye Hao

198

20 Oct 2021

Balancing Value Underestimation and Overestimation with Realistic Actor-Critic

394

19 Oct 2021

A Survey of Exploration Methods in Reinforcement Learning

408

106

01 Sep 2021

Cooperative Exploration for Multi-Agent Deep Reinforcement LearningInternational Conference on Machine Learning (ICML), 2021

393

132

23 Jul 2021

Decoupled Reinforcement Learning to Stabilise Intrinsically-Motivated ExplorationAdaptive Agents and Multi-Agent Systems (AAMAS), 2021

255

19 Jul 2021

Optimistic Reinforcement Learning by Forward Kullback-Leibler Divergence OptimizationNeural Networks (NN), 2021

Taisuke Kobayashi

241

27 May 2021

Principled Exploration via Optimistic Bootstrapping and Backward InductionInternational Conference on Machine Learning (ICML), 2021

Jianye Hao

242

13 May 2021

An Open-Source Multi-Goal Reinforcement Learning Environment for Robotic Manipulation with PybulletTowards Autonomous Robotic Systems (TAROS), 2021

246

12 May 2021

No-Regret Reinforcement Learning with Heavy-Tailed RewardsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Vincent Zhuang

Yanan Sui

875

25 Feb 2021

Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning

William F. Whitney

Michael Bloesch

Jost Tobias Springenberg

A. Abdolmaleki

Dong Wang

Martin Riedmiller

OffRL

331

23 Jan 2021

Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS), 2020

303

17 Oct 2020

Towards Tractable Optimism in Model-Based Reinforcement Learning

201

21 Jun 2020