Principled Exploration via Optimistic Bootstrapping and Backward Induction

13 May 2021

Jianye Hao

Papers citing "Principled Exploration via Optimistic Bootstrapping and Backward Induction"

25 / 25 papers shown

Title
A Tighter Convergence Proof of Reverse Experience Replay Nan Jiang Jinzhao Li Yexiang Xue 21 0 0 30 Aug 2024
Constrained Intrinsic Motivation for Reinforcement Learning Xiang Zheng Jie Zhang Chao Shen Cong Wang 36 1 0 12 Jul 2024
Model-Free Active Exploration in Reinforcement Learning Alessio Russo Alexandre Proutiere OffRL 25 2 0 30 Jun 2024
Constrained Ensemble Exploration for Unsupervised Skill Discovery Chenjia Bai Rushuai Yang Qiaosheng Zhang Kang Xu Yi Chen Ting Xiao Xuelong Li OffRL 45 3 0 25 May 2024
Ensemble Successor Representations for Task Generalization in Offline-to-Online Reinforcement Learning Changhong Wang Xudong Yu Chenjia Bai Qiaosheng Zhang Zhen Wang 42 1 0 12 May 2024
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Jianye Hao Zhuoran Yang Bin Zhao Zhen Wang Xuelong Li OffRL 39 9 0 30 Apr 2024
Learning Uncertainty-Aware Temporally-Extended Actions Joongkyu Lee Seung Joon Park Yunhao Tang Min-hwan Oh 24 2 0 08 Feb 2024
Adaptive trajectory-constrained exploration strategy for deep reinforcement learning Guojian Wang Faguo Wu Xiao Zhang Ning Guo Zhiming Zheng 41 3 0 27 Dec 2023
OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments Jinyi Liu Zhi Wang Yan Zheng Jianye Hao Chenjia Bai Junjie Ye Zhen Wang Haiyin Piao Yang Sun 40 6 0 19 Dec 2023
Stability of Multi-Agent Learning: Convergence in Network Games with Many Players A. Hussain D. Leonte Francesco Belardinelli Georgios Piliouras MLT 21 0 0 26 Jul 2023
Seizing Serendipity: Exploiting the Value of Past Success in Off-Policy Actor-Critic Tianying Ji Yuping Luo Gang Hua Xianyuan Zhan Jianwei Zhang Huazhe Xu OffRL OnRL 47 15 0 05 Jun 2023
Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu Chenjia Bai Xiaoteng Ma Dong Wang Bingyan Zhao Zhen Wang Xuelong Li Wei Li 37 15 0 28 May 2023
Behavior Contrastive Learning for Unsupervised Skill Discovery Rushuai Yang Chenjia Bai Hongyi Guo Siyuan Li Bin Zhao Zhen Wang Peng Liu Xuelong Li SSL 34 16 0 08 May 2023
Posterior Sampling for Deep Reinforcement Learning Remo Sasso Michelangelo Conserva Paulo E. Rauber OffRL BDL 42 6 0 30 Apr 2023
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 33 1 0 28 Nov 2022
Offline Reinforcement Learning with Adaptive Behavior Regularization Yunfan Zhou Xijun Li Qingyu Qu OffRL 27 1 0 15 Nov 2022
RORL: Robust Offline Reinforcement Learning via Conservative Smoothing Rui Yang Chenjia Bai Xiaoteng Ma Zhaoran Wang Chongjie Zhang Lei Han OffRL 32 74 0 06 Jun 2022
From Dirichlet to Rubin: Optimistic Exploration in RL without Bonuses D. Tiapkin Denis Belomestny Eric Moulines A. Naumov S. Samsonov Yunhao Tang Michal Valko Pierre Menard 34 17 0 16 May 2022
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Zhuoran Yang Zhihong Deng Animesh Garg Peng Liu Zhaoran Wang OffRL 45 132 0 23 Feb 2022
Anti-Concentrated Confidence Bonuses for Scalable Exploration Jordan T. Ash Cyril Zhang Surbhi Goel A. Krishnamurthy Sham Kakade 45 6 0 21 Oct 2021
Dynamic Bottleneck for Robust Self-Supervised Exploration Chenjia Bai Lingxiao Wang Lei Han Animesh Garg Jianye Hao Peng Liu Zhaoran Wang 32 29 0 20 Oct 2021
Exploration in Deep Reinforcement Learning: From Single-Agent to Multiagent Domain Jianye Hao Tianpei Yang Hongyao Tang Chenjia Bai Jinyi Liu Zhaopeng Meng Peng Liu Zhen Wang OffRL 41 93 0 14 Sep 2021
Provably Efficient Reinforcement Learning with Linear Function Approximation Under Adaptivity Constraints Chi Jin Zhuoran Yang Zhaoran Wang OffRL 122 167 0 06 Jan 2021
Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning Chenjia Bai Peng Liu Kaiyu Liu Zhaoran Wang Yingnan Zhao Lingxiao Wang SSL 6 18 0 17 Oct 2020
Optimism in Reinforcement Learning with Generalized Linear Function Approximation Yining Wang Ruosong Wang S. Du A. Krishnamurthy 137 135 0 09 Dec 2019