Adaptive Reward-Free Exploration

Adaptive Reward-Free Exploration

11 June 2020

Pierre Ménard

O. D. Domingues

Anders Jonsson

Edouard Leurent

Papers citing "Adaptive Reward-Free Exploration"

17 / 17 papers shown

Title
Cascading Reinforcement Learning Yihan Du R. Srikant Wei Chen 8 0 0 17 Jan 2024
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data Ruiqi Zhang Andrea Zanette OffRL OnRL 35 5 0 10 Jul 2023
Towards Theoretical Understanding of Inverse Reinforcement Learning Alberto Maria Metelli Filippo Lazzati Marcello Restelli 21 13 0 25 Apr 2023
Improved Sample Complexity for Reward-free Reinforcement Learning under Low-rank MDPs Yuan-Chia Cheng Ruiquan Huang J. Yang Yitao Liang OffRL 37 8 0 20 Mar 2023
Layered State Discovery for Incremental Autonomous Exploration Liyu Chen Andrea Tirinzoni A. Lazaric Matteo Pirotta 15 0 0 07 Feb 2023
Reward-Mixing MDPs with a Few Latent Contexts are Learnable Jeongyeol Kwon Yonathan Efroni C. Caramanis Shie Mannor 27 5 0 05 Oct 2022
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL Jinglin Chen Aditya Modi A. Krishnamurthy Nan Jiang Alekh Agarwal 30 25 0 21 Jun 2022
BYOL-Explore: Exploration by Bootstrapped Prediction Z. Guo S. Thakoor Miruna Pislar Bernardo Avila-Pires Florent Altché ... Yunhao Tang Michal Valko Rémi Munos M. G. Azar Bilal Piot 22 67 0 16 Jun 2022
Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information Yonathan Efroni Dylan J. Foster Dipendra Kumar Misra A. Krishnamurthy John Langford OffRL 24 25 0 09 Jun 2022
Branching Reinforcement Learning Yihan Du Wei Chen 11 0 0 16 Feb 2022
Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost Dan Qiao Ming Yin Ming Min Yu-Xiang Wang 24 28 0 13 Feb 2022
Reinforcement Learning in Reward-Mixing MDPs Jeongyeol Kwon Yonathan Efroni C. Caramanis Shie Mannor 25 15 0 07 Oct 2021
Gap-Dependent Unsupervised Exploration for Reinforcement Learning Jingfeng Wu Vladimir Braverman Lin F. Yang 22 12 0 11 Aug 2021
Optimal Uniform OPE and Model-based Offline Reinforcement Learning in Time-Homogeneous, Reward-Free and Task-Agnostic Settings Ming Yin Yu-Xiang Wang OffRL 16 19 0 13 May 2021
UCB Momentum Q-learning: Correcting the bias without forgetting Pierre Menard O. D. Domingues Xuedong Shang Michal Valko 77 40 0 01 Mar 2021
Improved Corruption Robust Algorithms for Episodic Reinforcement Learning Yifang Chen S. Du Kevin G. Jamieson 16 22 0 13 Feb 2021
Reward-Free Exploration for Reinforcement Learning Chi Jin A. Krishnamurthy Max Simchowitz Tiancheng Yu OffRL 104 194 0 07 Feb 2020