Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost

13 February 2022

Ming Yin

Papers citing "Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost"

27 / 27 papers shown

Title
No-regret Exploration in Shuffle Private Reinforcement Learning Shaojie Bai Mohammad Sadegh Talebi Chengcheng Zhao Peng Cheng Jiming Chen OffRL 66 0 0 18 Nov 2024
Learning in Markov Games with Adaptive Adversaries: Policy Regret, Fundamental Barriers, and Efficient Algorithms Thanh Nguyen-Tang Raman Arora 74 1 0 01 Nov 2024
Federated UCBVI: Communication-Efficient Federated Regret Minimization with Heterogeneous Agents Safwan Labbi D. Tiapkin Lorenzo Mancini Paul Mangold Eric Moulines FedML 68 0 0 30 Oct 2024
Gap-Dependent Bounds for Q-Learning using Reference-Advantage Decomposition Zhong Zheng Haochen Zhang Lingzhou Xue OffRL 70 2 0 10 Oct 2024
To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning Tao Ma Xuzhi Yang Zoltan Szabo OffRL 58 0 0 01 Jul 2024
Stable Minima Cannot Overfit in Univariate ReLU Networks: Generalization by Large Step Sizes Dan Qiao Kaiqi Zhang Esha Singh Daniel Soudry Yu-Xiang Wang NoLa 31 3 0 10 Jun 2024
Differentially Private Reinforcement Learning with Self-Play Dan Qiao Yu-Xiang Wang 36 0 0 11 Apr 2024
Batched Nonparametric Contextual Bandits Rong Jiang Cong Ma OffRL 31 1 0 27 Feb 2024
Near-Optimal Reinforcement Learning with Self-Play under Adaptivity Constraints Dan Qiao Yu-Xiang Wang OffRL 22 3 0 02 Feb 2024
Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge Meshal Alharbi Mardavij Roozbehani M. Dahleh 14 0 0 19 Dec 2023
Sample-Efficiency in Multi-Batch Reinforcement Learning: The Need for Dimension-Dependent Adaptivity Emmeran Johnson Ciara Pike-Burke Patrick Rebeschini OffRL 19 2 0 02 Oct 2023
Policy Finetuning in Reinforcement Learning via Design of Experiments using Offline Data Ruiqi Zhang Andrea Zanette OffRL OnRL 35 5 0 10 Jul 2023
Offline Policy Evaluation for Reinforcement Learning with Adaptively Collected Data Sunil Madhow Dan Xiao Ming Yin Yu-Xiang Wang OffRL 18 0 0 24 Jun 2023
Regret-Optimal Model-Free Reinforcement Learning for Discounted MDPs with Short Burn-In Time Xiang Ji Gen Li OffRL 14 7 0 24 May 2023
Minimax-Optimal Reward-Agnostic Exploration in Reinforcement Learning Gen Li Yuling Yan Yuxin Chen Jianqing Fan OffRL 68 12 0 14 Apr 2023
Logarithmic Switching Cost in Reinforcement Learning beyond Linear MDPs Dan Qiao Ming Yin Yu-Xiang Wang 17 6 0 24 Feb 2023
Near-Optimal Adversarial Reinforcement Learning with Switching Costs Ming Shi Yitao Liang Ness B. Shroff 15 2 0 08 Feb 2023
A Reduction-based Framework for Sequential Decision Making with Delayed Feedback Yunchang Yang Hangshi Zhong Tianhao Wu B. Liu Liwei Wang S. Du OffRL 20 8 0 03 Feb 2023
Near-Optimal Differentially Private Reinforcement Learning Dan Qiao Yu-Xiang Wang 22 13 0 09 Dec 2022
Near-Optimal Regret Bounds for Multi-batch Reinforcement Learning Zihan Zhang Yuhang Jiang Yuanshuo Zhou Xiangyang Ji OffRL 21 9 0 15 Oct 2022
Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient Ming Yin Mengdi Wang Yu-Xiang Wang OffRL 61 11 0 03 Oct 2022
Near-Optimal Deployment Efficiency in Reward-Free Reinforcement Learning with Linear Function Approximation Dan Qiao Yu-Xiang Wang OffRL 61 13 0 03 Oct 2022
Doubly Fair Dynamic Pricing Jianyu Xu Dan Qiao Yu-Xiang Wang 11 8 0 23 Sep 2022
Offline Reinforcement Learning with Differential Privacy Dan Qiao Yu-Xiang Wang OffRL 27 23 0 02 Jun 2022
Online Sub-Sampling for Reinforcement Learning with General Function Approximation Dingwen Kong Ruslan Salakhutdinov Ruosong Wang Lin F. Yang OffRL 25 1 0 14 Jun 2021
Provably Efficient Reinforcement Learning with Linear Function Approximation Under Adaptivity Constraints Chi Jin Zhuoran Yang Zhaoran Wang OffRL 107 166 0 06 Jan 2021
Reward-Free Exploration for Reinforcement Learning Chi Jin A. Krishnamurthy Max Simchowitz Tiancheng Yu OffRL 104 194 0 07 Feb 2020