Provably Efficient Reinforcement Learning with Linear Function Approximation

11 July 2019

Papers citing "Provably Efficient Reinforcement Learning with Linear Function Approximation"

50 / 151 papers shown

Title
Refined Regret for Adversarial MDPs with Linear Function Approximation Yan Dai Haipeng Luo Chen-Yu Wei Julian Zimmert 31 12 0 30 Jan 2023
STEERING: Stein Information Directed Exploration for Model-Based Reinforcement Learning Souradip Chakraborty Amrit Singh Bedi Alec Koppel Mengdi Wang Furong Huang Dinesh Manocha 24 7 0 28 Jan 2023
Provable Reset-free Reinforcement Learning by No-Regret Reduction Hoai-An Nguyen Ching-An Cheng OffRL 23 2 0 06 Jan 2023
Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private Information Zuyue Fu Zhengling Qi Zhuoran Yang Zhaoran Wang Lan Wang OffRL 20 0 0 23 Dec 2022
Near-optimal Policy Identification in Active Reinforcement Learning Xiang Li Viraj Mehta Johannes Kirschner I. Char W. Neiswanger J. Schneider Andreas Krause Ilija Bogunovic OffRL 43 6 0 19 Dec 2022
Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision Processes Jiafan He Heyang Zhao Dongruo Zhou Quanquan Gu OffRL 51 53 0 12 Dec 2022
Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear Contextual Bandits and Markov Decision Processes Chen Ye Wei Xiong Quanquan Gu Tong Zhang 31 29 0 12 Dec 2022
Causal Deep Reinforcement Learning Using Observational Data Wenxuan Zhu Chao Yu Qiaosheng Zhang CML OffRL 26 5 0 28 Nov 2022
CIM: Constrained Intrinsic Motivation for Sparse-Reward Continuous Control Xiang Zheng Xingjun Ma Cong Wang 28 1 0 28 Nov 2022
On Instance-Dependent Bounds for Offline Reinforcement Learning with Linear Function Approximation Thanh Nguyen-Tang Ming Yin Sunil R. Gupta Svetha Venkatesh R. Arora OffRL 58 16 0 23 Nov 2022
Efficient Global Planning in Large MDPs via Stochastic Primal-Dual Optimization Gergely Neu Nneka Okolo 34 6 0 21 Oct 2022
On the Power of Pre-training for Generalization in RL: Provable Benefits and Hardness Haotian Ye Xiaoyu Chen Liwei Wang S. Du OffRL 34 6 0 19 Oct 2022
On the Convergence of Monte Carlo UCB for Random-Length Episodic MDPs Zixuan Dong Che Wang Keith Ross 33 3 0 07 Sep 2022
Dynamic Regret of Online Markov Decision Processes Peng Zhao Longfei Li Zhi-Hua Zhou OffRL 27 17 0 26 Aug 2022
A Provably Efficient Model-Free Posterior Sampling Method for Episodic Reinforcement Learning Christoph Dann M. Mohri Tong Zhang Julian Zimmert OffRL 18 33 0 23 Aug 2022
Spectral Decomposition Representation for Reinforcement Learning Tongzheng Ren Tianjun Zhang Lisa Lee Joseph E. Gonzalez Dale Schuurmans Bo Dai OffRL 40 27 0 19 Aug 2022
Best Policy Identification in Linear MDPs Jerome Taupin Yassir Jedra Alexandre Proutière 41 3 0 11 Aug 2022
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning Shuang Qiu Lingxiao Wang Chenjia Bai Zhuoran Yang Zhaoran Wang SSL OffRL 26 32 0 29 Jul 2022
A Few Expert Queries Suffices for Sample-Efficient RL with Resets and Linear Value Approximation P. Amortila Nan Jiang Dhruv Madeka Dean Phillips Foster 21 5 0 18 Jul 2022
Making Linear MDPs Practical via Contrastive Representation Learning Tianjun Zhang Tongzheng Ren Mengjiao Yang Joseph E. Gonzalez Dale Schuurmans Bo Dai 25 44 0 14 Jul 2022
Provably Efficient Reinforcement Learning for Online Adaptive Influence Maximization Kaixuan Huang Yuehua Wu Xuezhou Zhang Shenyinying Tu Qingyun Wu Mengdi Wang Huazheng Wang 28 1 0 29 Jun 2022
Computationally Efficient PAC RL in POMDPs with Latent Determinism and Conditional Embeddings Masatoshi Uehara Ayush Sekhari Jason D. Lee Nathan Kallus Wen Sun 60 6 0 24 Jun 2022
Provably Efficient Reinforcement Learning in Partially Observable Dynamical Systems Masatoshi Uehara Ayush Sekhari Jason D. Lee Nathan Kallus Wen Sun OffRL 49 31 0 24 Jun 2022
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL Jinglin Chen Aditya Modi A. Krishnamurthy Nan Jiang Alekh Agarwal 38 25 0 21 Jun 2022
Model-based RL with Optimistic Posterior Sampling: Structural Conditions and Sample Complexity Alekh Agarwal Tong Zhang 47 22 0 15 Jun 2022
Achieving Zero Constraint Violation for Constrained Reinforcement Learning via Conservative Natural Policy Gradient Primal-Dual Algorithm Qinbo Bai Amrit Singh Bedi Vaneet Aggarwal 26 20 0 12 Jun 2022
Sample-Efficient Reinforcement Learning of Partially Observable Markov Games Qinghua Liu Csaba Szepesvári Chi Jin 40 20 0 02 Jun 2022
Offline Reinforcement Learning with Differential Privacy Dan Qiao Yu-Xiang Wang OffRL 39 23 0 02 Jun 2022
Provably Efficient Kernelized Q-Learning Shuang Liu H. Su MLT 25 4 0 21 Apr 2022
Jump-Start Reinforcement Learning Ikechukwu Uchendu Ted Xiao Yao Lu Banghua Zhu Mengyuan Yan ... Chuyuan Fu Cong Ma Jiantao Jiao Sergey Levine Karol Hausman OffRL OnRL 44 109 0 05 Apr 2022
Near-optimal Offline Reinforcement Learning with Linear Representation: Leveraging Variance Information with Pessimism Ming Yin Yaqi Duan Mengdi Wang Yu-Xiang Wang OffRL 34 66 0 11 Mar 2022
A Complete Characterization of Linear Estimators for Offline Policy Evaluation Juan C. Perdomo A. Krishnamurthy Peter L. Bartlett Sham Kakade OffRL 27 3 0 08 Mar 2022
Learn to Match with No Regret: Reinforcement Learning in Markov Matching Markets Yifei Min Tianhao Wang Ruitu Xu Zhaoran Wang Michael I. Jordan Zhuoran Yang 33 21 0 07 Mar 2022
Target Network and Truncation Overcome The Deadly Triad in $Q$ -Learning Zaiwei Chen John-Paul Clarke S. T. Maguluri 18 19 0 05 Mar 2022
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Zhuoran Yang Zhihong Deng Animesh Garg Peng Liu Zhaoran Wang OffRL 37 132 0 23 Feb 2022
Sample-Efficient Reinforcement Learning with loglog(T) Switching Cost Dan Qiao Ming Yin Ming Min Yu-Xiang Wang 40 28 0 13 Feb 2022
Improved Regret for Differentially Private Exploration in Linear MDP Dung Daniel Ngo G. Vietri Zhiwei Steven Wu 17 8 0 02 Feb 2022
Efficient Reinforcement Learning in Block MDPs: A Model-free Representation Learning Approach Xuezhou Zhang Yuda Song Masatoshi Uehara Mengdi Wang Alekh Agarwal Wen Sun OffRL 29 57 0 31 Jan 2022
Near-Optimal Regret for Adversarial MDP with Delayed Bandit Feedback Tiancheng Jin Tal Lancewicki Haipeng Luo Yishay Mansour Aviv A. Rosenberg 74 21 0 31 Jan 2022
Exponential Family Model-Based Reinforcement Learning via Score Matching Gen Li Junbo Li Anmol Kabra Nathan Srebro Zhaoran Wang Zhuoran Yang 32 4 0 28 Dec 2021
Differentially Private Regret Minimization in Episodic Markov Decision Processes Sayak Ray Chowdhury Xingyu Zhou 26 21 0 20 Dec 2021
Misspecified Gaussian Process Bandit Optimization Ilija Bogunovic Andreas Krause 55 42 0 09 Nov 2021
Safe Policy Optimization with Local Generalized Linear Function Approximations Akifumi Wachi Yunyue Wei Yanan Sui OffRL 30 10 0 09 Nov 2021
Exponential Bellman Equation and Improved Regret Bounds for Risk-Sensitive Reinforcement Learning Yingjie Fei Zhuoran Yang Yudong Chen Zhaoran Wang 41 46 0 06 Nov 2021
Perturbational Complexity by Distribution Mismatch: A Systematic Analysis of Reinforcement Learning in Reproducing Kernel Hilbert Space Jihao Long Jiequn Han 29 6 0 05 Nov 2021
Adaptive Discretization in Online Reinforcement Learning Sean R. Sinclair Siddhartha Banerjee Chao Yu OffRL 40 15 0 29 Oct 2021
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection Matteo Papini Andrea Tirinzoni Aldo Pacchiano Marcello Restelli A. Lazaric Matteo Pirotta 19 18 0 27 Oct 2021
Learning Stochastic Shortest Path with Linear Function Approximation Steffen Czolbe Jiafan He Adrian V. Dalca Quanquan Gu 39 30 0 25 Oct 2021
Locally Differentially Private Reinforcement Learning for Linear Mixture Markov Decision Processes Chonghua Liao Jiafan He Quanquan Gu 16 17 0 19 Oct 2021
Representation Learning for Online and Offline RL in Low-rank MDPs Masatoshi Uehara Xuezhou Zhang Wen Sun OffRL 62 127 0 09 Oct 2021