v1v2v3v4 (latest)

Efficient Exploration through Bayesian Deep Q-Networks

13 February 2018

Kamyar Azizzadenesheli

Papers citing "Efficient Exploration through Bayesian Deep Q-Networks"

50 / 101 papers shown

Enhancing Q-Value Updates in Deep Q-Learning via Successor-State Prediction

Lipeng Zu

Hansong Zhou

Xiaonan Zhang

121

05 Nov 2025

The Confusing Instance Principle for Online Linear Quadratic Control

Waris Radji

Odalric-Ambrym Maillard

OffRL

180

22 Oct 2025

Priors Matter: Addressing Misspecification in Bayesian Deep Q-Learning

Pascal R. van der Vaart

Neil Yorke-Smith

M. Spaan

BDL UQCV

213

29 Aug 2025

Q-learning with Posterior Sampling

367

01 Jun 2025

Exploration-Driven Generative Interactive EnvironmentsComputer Vision and Pattern Recognition (CVPR), 2025

311

03 Apr 2025

Look Before Leap: Look-Ahead Planning with Uncertainty in Reinforcement Learning

Yongshuai Liu

Xin Liu

413

26 Mar 2025

CAE: Repurposing the Critic as an Explorer in Deep Reinforcement Learning

Yexin Li

OffRL

479

23 Mar 2025

EVaDE : Event-Based Variational Thompson Sampling for Model-Based Reinforcement LearningAsian Conference on Machine Learning (ACML), 2025

326

17 Jan 2025

Spatial-Aware Decision-Making with Ring Attractors in Reinforcement Learning Systems

1.0K

04 Oct 2024

Model-Free Active Exploration in Reinforcement Learning

Alessio Russo

Alexandre Proutiere

OffRL

394

30 Jun 2024

Sparse Bayesian Networks: Efficient Uncertainty Quantification in Medical Image Analysis

281

11 Jun 2024

Constrained Ensemble Exploration for Unsupervised Skill Discovery

Xuelong Li

491

25 May 2024

Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning

Jianye Hao

Zhen Wang

Xuelong Li

OffRL

319

30 Apr 2024

Variational Bayesian Last Layers

440

17 Apr 2024

Utilizing Maximum Mean Discrepancy Barycenter for Propagating the Uncertainty of Value Functions in Reinforcement Learning

Srinjoy Roy

Swagatam Das

358

31 Mar 2024

A Bayesian Framework of Deep Reinforcement Learning for Joint O-RAN/MEC Orchestration

Fahri Wisnu Murti

Samad Ali

Matti Latva-aho

308

26 Dec 2023

Multi-Agent Probabilistic Ensembles with Trajectory Sampling for Connected Autonomous Vehicles

329

21 Dec 2023

On the Convergence and Sample Complexity Analysis of Deep Q-Networks with

ε

-Greedy ExplorationNeural Information Processing Systems (NeurIPS), 2023

Shuai Zhang

364

24 Oct 2023

Uncertainty-aware transfer across tasks using hybrid model-based successor feature reinforcement learning

Parvin Malekzadeh

Ming Hou

Konstantinos N. Plataniotis

357

16 Oct 2023

Uncertainty Quantification using Generative Approach

Yunsheng Zhang

UQCV BDL

133

13 Oct 2023

ReLU to the Rescue: Improve Your On-Policy Actor-Critic with Positive AdvantagesInternational Conference on Machine Learning (ICML), 2023

449

02 Jun 2023

Provable and Practical: Efficient Exploration in Reinforcement Learning via Langevin Monte CarloInternational Conference on Learning Representations (ICLR), 2023

Kamyar Azizzadenesheli

BDL OffRL

430

29 May 2023

Posterior Sampling for Deep Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

Remo Sasso

Michelangelo Conserva

Paulo E. Rauber

OffRL BDL

295

30 Apr 2023

Decision-Making Under Uncertainty: Beyond ProbabilitiesInternational Journal on Software Tools for Technology Transfer (STTT) (STTT), 2023

316

10 Mar 2023

Exploration via Epistemic Value EstimationAAAI Conference on Artificial Intelligence (AAAI), 2023

197

07 Mar 2023

Learning How to Infer Partial MDPs for In-Context Adaptation and Exploration

Chentian Jiang

Nan Rosemary Ke

Hado van Hasselt

415

08 Feb 2023

The Role of Exploration for Task Transfer in Reinforcement Learning

Jonathan C. Balloch

Julia Kim

Jessica B. Langebrake Inman

Mark O. Riedl

OffRL

275

11 Oct 2022

POEM: Out-of-Distribution Detection with Posterior SamplingInternational Conference on Machine Learning (ICML), 2022

353

148

28 Jun 2022

SFP: State-free Priors for Exploration in Off-Policy Reinforcement Learning

Marco Bagatella

Sammy Christen

Otmar Hilliges

OffRL

483

26 May 2022

From Dirichlet to Rubin: Optimistic Exploration in RL without BonusesInternational Conference on Machine Learning (ICML), 2022

Pierre Menard

315

16 May 2022

Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2022

370

168

23 Feb 2022

BADDr: Bayes-Adaptive Deep Dropout RL for POMDPsAdaptive Agents and Multi-Agent Systems (AAMAS), 2022

141

17 Feb 2022

Fast online inference for nonlinear contextual bandit based on Generative Adversarial Network

Yun-Da Tsai

Shou-De Lin

213

17 Feb 2022

Towards Interactive Reinforcement Learning with Intrinsic Feedback

Ben Poole

Minwoo Lee

OffRL

320

02 Dec 2021

Which Model to Trust: Assessing the Influence of Models on the Performance of Reinforcement Learning Algorithms for Continuous Control Tasks

366

25 Oct 2021

Knowledge is reward: Learning optimal exploration by predictive reward cashing

Luca Ambrogioni

139

17 Sep 2021

DROMO: Distributionally Robust Offline Model-based Policy Optimization

224

15 Sep 2021

Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain

Jianye Hao

Zhen Wang

516

175

14 Sep 2021

A Survey of Exploration Methods in Reinforcement Learning

408

106

01 Sep 2021

Analytically Tractable Bayesian Deep Q-Learning

175

21 Jun 2021

On the Sample Complexity and Metastability of Heavy-tailed Policy Search in Continuous Control

Mengdi Wang

216

15 Jun 2021

Reinforced Few-Shot Acquisition Function Learning for Bayesian OptimizationNeural Information Processing Systems (NeurIPS), 2021

Bing-Jing Hsieh

Ping-Chun Hsieh

Xi Liu

314

08 Jun 2021

Mitigating Covariate Shift in Imitation Learning via Offline Data Without Great Coverage

382

06 Jun 2021

Multi-facet Contextual Bandits: A Neural Network PerspectiveKnowledge Discovery and Data Mining (KDD), 2021

Yikun Ban

Jingrui He

C. Cook

453

06 Jun 2021

Sample-Efficient Reinforcement Learning for Linearly-Parameterized MDPs with a Generative ModelNeural Information Processing Systems (NeurIPS), 2021

Bingyan Wang

Yuling Yan

Jianqing Fan

507

28 May 2021

Principled Exploration via Optimistic Bootstrapping and Backward InductionInternational Conference on Machine Learning (ICML), 2021

Jianye Hao

242

13 May 2021

Meta-Learning-Based Robust Adaptive Flight Control Under Uncertain Wind Conditions

228

02 Mar 2021

MobILE: Model-Based Imitation Learning From Observation AloneNeural Information Processing Systems (NeurIPS), 2021

Rahul Kidambi

Jonathan D. Chang

Wen Sun

308

22 Feb 2021

Output-Weighted Sampling for Multi-Armed Bandits with Extreme PayoffsProceedings of the Royal Society A (Proc. R. Soc. A), 2021

253

19 Feb 2021

COMBO: Conservative Offline Model-Based Policy OptimizationNeural Information Processing Systems (NeurIPS), 2021

Aravind Rajeswaran

768

510

16 Feb 2021