v1v2v3 (latest)

#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning

15 November 2016

Pieter Abbeel

Papers citing "#Exploration: A Study of Count-Based Exploration for Deep Reinforcement Learning"

50 / 467 papers shown

PreND: Enhancing Intrinsic Motivation in Reinforcement Learning through Pre-trained Network Distillation

Mohammadamin Davoodabadi

Negin Hashemi Dijujin

M. Baghshah

195

02 Oct 2024

Quasimetric Value Functions with Dense Rewards

Khadichabonu Valieva

Bikramjit Banerjee

OffRL

249

13 Sep 2024

Directed Exploration in Reinforcement Learning from Linear Temporal Logic

321

18 Aug 2024

A Single Goal is All You Need: Skills and Exploration Emerge from Contrastive RL without Rewards, Demonstrations, or SubgoalsInternational Conference on Learning Representations (ICLR), 2024

400

11 Aug 2024

Highly Efficient Self-Adaptive Reward Shaping for Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2024

691

06 Aug 2024

Image-Based Deep Reinforcement Learning with Intrinsically Motivated Stimuli: On the Execution of Complex Robotic Tasks

Yuning Xing

152

31 Jul 2024

Boosting Efficiency in Task-Agnostic Exploration through Causal Knowledge

247

30 Jul 2024

Sparsity-based Safety Conservatism for Constrained Offline Reinforcement Learning

Minjae Cho

Chuangchuang Sun

OffRL

292

17 Jul 2024

Variable-Agnostic Causal Exploration for Reinforcement Learning

258

17 Jul 2024

Can Learned Optimization Make Reinforcement Learning Less Difficult?

Alexander David Goldie

515

09 Jul 2024

Preference-Guided Reinforcement Learning for Efficient Exploration

278

09 Jul 2024

PUZZLES: A Benchmark for Neural Algorithmic Reasoning

360

29 Jun 2024

Safety through feedback in Constrained RL

Shashank Reddy Chirra

Pradeep Varakantham

P. Paruchuri

OffRL

414

28 Jun 2024

Beyond Optimism: Exploration With Partially Observable Rewards

229

20 Jun 2024

WoCoCo: Learning Whole-Body Humanoid Control with Sequential ContactsConference on Robot Learning (CoRL), 2024

334

10 Jun 2024

LAGMA: LAtent Goal-guided Multi-Agent Reinforcement Learning

Hyungho Na

IL-Chul Moon

199

30 May 2024

RLeXplore: Accelerating Research in Intrinsically-Motivated Reinforcement Learning

Mingqi Yuan

Roger Creus Castanyer

486

29 May 2024

Exclusively Penalized Q-learning for Offline Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

311

23 May 2024

Enhancing Q-Learning with Large Language Model Heuristics

Xiefeng Wu

LRM

335

06 May 2024

Generative Active Learning for the Search of Small-molecule Protein Binders

Moksh Jain

...

196

02 May 2024

MESA: Cooperative Meta-Exploration in Multi-Agent Learning through Exploiting State-Action Space Structure

194

01 May 2024

Goal Exploration via Adaptive Skill Distribution for Goal-Conditioned Reinforcement Learning

Lisheng Wu

Ke Chen

194

19 Apr 2024

Grid-Mapping Pseudo-Count Constraint for Offline Reinforcement Learning

Yi Shen

Hanyan Huang

Shan Xie

225

03 Apr 2024

VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts

Marius Captari

Remo Sasso

M. Sabatelli

105

26 Mar 2024

Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning

Hyungho Na

Yunkyeong Seo

IL-Chul Moon

270

02 Mar 2024

ACE : Off-Policy Actor-Critic with Causality-Aware Entropy Regularization

Furong Huang

322

22 Feb 2024

Decentralized Lifelong Path Planning for Multiple Ackerman Car-Like Robots

Teng Guo

Jingjin Yu

226

19 Feb 2024

Just Cluster It: An Approach for Exploration in High-Dimensions using Clustering and Pre-Trained RepresentationsInternational Conference on Machine Learning (ICML), 2024

Stefan Sylvius Wagner

Stefan Harmeling

198

05 Feb 2024

Settling Decentralized Multi-Agent Coordinated Exploration by Novelty Sharing

Haobin Jiang

Zongqing Lu

256

03 Feb 2024

To the Max: Reinventing Reward in Reinforcement Learning

Grigorii Veviurko

Wendelin Bohmer

Mathijs de Weerdt

226

02 Feb 2024

Scheduled Curiosity-Deep Dyna-Q: Efficient Exploration for Dialog Policy Learning

Xuecheng Niu

Akinori Ito

Takashi Nose

255

31 Jan 2024

DittoGym: Learning to Control Soft Shape-Shifting RobotsInternational Conference on Learning Representations (ICLR), 2024

305

24 Jan 2024

Exploration and Anti-Exploration with Distributional Random Network Distillation

453

18 Jan 2024

Beyond Sparse Rewards: Enhancing Reinforcement Learning with Language Model Critique in Text Generation

325

14 Jan 2024

Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning

...

Jianye Hao

Youssef Attia El Hili

Haitham Bou-Ammar

Jun Wang

233

22 Dec 2023

Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization

Takuya Hiraoka

OffRL

275

10 Dec 2023

Regularity as Intrinsic Reward for Free PlayNeural Information Processing Systems (NeurIPS), 2023

Cansu Sancaktar

J. Piater

Georg Martius

242

03 Dec 2023

On-Policy Policy Gradient Reinforcement Learning Without On-Policy Sampling

Nicholas Corrado

Josiah P. Hanna

OffRL

165

14 Nov 2023

General Policies, Subgoal Structure, and Planning WidthJournal of Artificial Intelligence Research (JAIR), 2023

Blai Bonet

Hector Geffner

158

09 Nov 2023

Accelerating Exploration with Unlabeled Prior Data

358

09 Nov 2023

DrM: Mastering Visual Reinforcement Learning through Dormant Ratio MinimizationInternational Conference on Learning Representations (ICLR), 2023

...

Furong Huang

312

30 Oct 2023

Improving Intrinsic Exploration by Creating Stationary ObjectivesInternational Conference on Learning Representations (ICLR), 2023

Roger Creus Castanyer

Javier Civera

Taihú Pire

OffRL

395

27 Oct 2023

Understanding when Dynamics-Invariant Data Augmentations Benefit Model-Free Reinforcement Learning UpdatesInternational Conference on Learning Representations (ICLR), 2023

Nicholas Corrado

Josiah P. Hanna

293

26 Oct 2023

Neuro-Inspired Fragmentation and Recall to Overcome Catastrophic Forgetting in Curiosity

Jaedong Hwang

Ila Fiete

168

26 Oct 2023

Reward Shaping for Happier Autonomous Cyber Security Agents

Elizabeth Bates

V. Mavroudis

Chris Hicks

262

20 Oct 2023

Provable Benefits of Multi-task RL under Non-Markovian Decision Making Processes

245

20 Oct 2023

METRA: Scalable Unsupervised RL with Metric-Aware AbstractionInternational Conference on Learning Representations (ICLR), 2023

388

13 Oct 2023

ELDEN: Exploration via Local DependenciesNeural Information Processing Systems (NeurIPS), 2023

Jiaheng Hu

Zizhao Wang

Peter Stone

Roberto Martin-Martin

219

12 Oct 2023

Offline Retraining for Online RL: Decoupled Policy Learning to Mitigate Exploration Bias

307

12 Oct 2023

Generative Intrinsic Optimization: Intrinsic Control with Model Learning

Jianfei Ma

263

12 Oct 2023