Representation Learning for Online and Offline RL in Low-rank MDPs

9 October 2021

Papers citing "Representation Learning for Online and Offline RL in Low-rank MDPs"

50 / 104 papers shown

Title
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism Zihao Li Zhuoran Yang Mengdi Wang OffRL 29 52 0 29 May 2023
The Benefits of Being Distributional: Small-Loss Bounds for Reinforcement Learning Kaiwen Wang Kevin Zhou Runzhe Wu Nathan Kallus Wen Sun OffRL 21 17 0 25 May 2023
Matrix Estimation for Offline Reinforcement Learning with Low-Rank Structure Xumei Xi C. Yu Yudong Chen OffRL 14 0 0 24 May 2023
On the Statistical Efficiency of Mean Field Reinforcement Learning with General Function Approximation Jiawei Huang Batuhan Yardim Niao He 23 10 0 18 May 2023
Representation Learning with Multi-Step Inverse Kinematics: An Efficient and Optimal Approach to Rich-Observation RL Zakaria Mhammedi Dylan J. Foster Alexander Rakhlin 63 18 0 12 Apr 2023
Sequential Knockoffs for Variable Selection in Reinforcement Learning Tao Ma Hengrui Cai Zhengling Qi C. Shi Eric B. Laber 16 3 0 24 Mar 2023
Improved Sample Complexity for Reward-free Reinforcement Learning under Low-rank MDPs Yuan-Chia Cheng Ruiquan Huang J. Yang Yitao Liang OffRL 37 8 0 20 Mar 2023
A New Policy Iteration Algorithm For Reinforcement Learning in Zero-Sum Markov Games Anna Winnicki R. Srikant 22 1 0 17 Mar 2023
Distributional Offline Policy Evaluation with Predictive Error Guarantees Runzhe Wu Masatoshi Uehara Wen Sun OffRL 21 13 0 19 Feb 2023
Near-Minimax-Optimal Risk-Sensitive Reinforcement Learning with CVaR Kaiwen Wang Nathan Kallus Wen Sun 92 18 0 07 Feb 2023
Reinforcement Learning in Low-Rank MDPs with Density Features Audrey Huang Jinglin Chen Nan Jiang OffRL 6 14 0 04 Feb 2023
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu Paria Rashidinejad Jiantao Jiao OffRL 25 15 0 30 Jan 2023
Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning Haoxuan Pan Deheng Ye Xiaoming Duan Qiang Fu Wei Yang Jianping He Mingfei Sun OffRL 21 2 0 20 Jan 2023
Latent Variable Representation for Reinforcement Learning Tongzheng Ren Chenjun Xiao Tianjun Zhang Na Li Zhaoran Wang Sujay Sanghavi Dale Schuurmans Bo Dai OffRL 11 10 0 17 Dec 2022
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian Paria Rashidinejad Hanlin Zhu Kunhe Yang Stuart J. Russell Jiantao Jiao OffRL 33 26 0 01 Nov 2022
Agent-Controller Representations: Principled Offline RL with Rich Exogenous Information Riashat Islam Manan Tomar Alex Lamb Yonathan Efroni Hongyu Zang ... Dipendra Kumar Misra Xin-hui Li H. V. Seijen Rémi Tachet des Combes John Langford OffRL 17 6 0 31 Oct 2022
Provable Safe Reinforcement Learning with Binary Feedback Andrew Bennett Dipendra Kumar Misra Nathan Kallus OffRL 20 4 0 26 Oct 2022
A Reinforcement Learning Approach in Multi-Phase Second-Price Auction Design Rui Ai Boxiang Lyu Zhaoran Wang Zhuoran Yang Michael I. Jordan 13 4 0 19 Oct 2022
Hybrid RL: Using Both Offline and Online Data Can Make RL Efficient Yuda Song Yi Zhou Ayush Sekhari J. Andrew Bagnell A. Krishnamurthy Wen Sun OffRL OnRL 25 90 0 13 Oct 2022
Offline Reinforcement Learning with Differentiable Function Approximation is Provably Efficient Ming Yin Mengdi Wang Yu-Xiang Wang OffRL 46 11 0 03 Oct 2022
Linear Convergence for Natural Policy Gradient with Log-linear Policy Parametrization Carlo Alfano Patrick Rebeschini 49 13 0 30 Sep 2022
Spectral Decomposition Representation for Reinforcement Learning Tongzheng Ren Tianjun Zhang Lisa Lee Joseph E. Gonzalez Dale Schuurmans Bo Dai OffRL 29 27 0 19 Aug 2022
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning Shuang Qiu Lingxiao Wang Chenjia Bai Zhuoran Yang Zhaoran Wang SSL OffRL 8 32 0 29 Jul 2022
Making Linear MDPs Practical via Contrastive Representation Learning Tianjun Zhang Tongzheng Ren Mengjiao Yang Joseph E. Gonzalez Dale Schuurmans Bo Dai 20 44 0 14 Jul 2022
Learning Bellman Complete Representations for Offline Policy Evaluation Jonathan D. Chang Kaiwen Wang Nathan Kallus Wen Sun OffRL 19 14 0 12 Jul 2022
On the Principles of Parsimony and Self-Consistency for the Emergence of Intelligence Y. Ma Doris Y. Tsao H. Shum 59 75 0 11 Jul 2022
Safe Exploration Incurs Nearly No Additional Sample Complexity for Reward-free RL Ruiquan Huang J. Yang Yingbin Liang OffRL 53 9 0 28 Jun 2022
Provably Efficient Reinforcement Learning in Partially Observable Dynamical Systems Masatoshi Uehara Ayush Sekhari Jason D. Lee Nathan Kallus Wen Sun OffRL 49 31 0 24 Jun 2022
On the Statistical Efficiency of Reward-Free Exploration in Non-Linear RL Jinglin Chen Aditya Modi A. Krishnamurthy Nan Jiang Alekh Agarwal 24 25 0 21 Jun 2022
Model-based RL with Optimistic Posterior Sampling: Structural Conditions and Sample Complexity Alekh Agarwal Tong Zhang 31 22 0 15 Jun 2022
Sample-Efficient Reinforcement Learning in the Presence of Exogenous Information Yonathan Efroni Dylan J. Foster Dipendra Kumar Misra A. Krishnamurthy John Langford OffRL 24 25 0 09 Jun 2022
Overcoming the Long Horizon Barrier for Sample-Efficient Reinforcement Learning with Latent Low-Rank Structure Tyler Sam Yudong Chen C. Yu OffRL 18 6 0 07 Jun 2022
On Gap-dependent Bounds for Offline Reinforcement Learning Xinqi Wang Qiwen Cui S. Du OffRL 68 11 0 01 Jun 2022
No-regret Learning in Repeated First-Price Auctions with Budget Constraints Rui Ai Chang Wang Chenchen Li Jinshan Zhang Wenhan Huang Xiaotie Deng 15 10 0 29 May 2022
Provable Benefits of Representational Transfer in Reinforcement Learning Alekh Agarwal Yuda Song Wen Sun Kaiwen Wang Mengdi Wang Xuezhou Zhang OffRL 16 33 0 29 May 2022
Embed to Control Partially Observed Systems: Representation Learning with Provable Sample Efficiency Lingxiao Wang Qi Cai Zhuoran Yang Zhaoran Wang 43 17 0 26 May 2022
$Pessimism for Offline Linear Contextual Bandits using $\ell_p$ Confidence Sets$ Pessimism for Offline Linear Contextual Bandits using $\ell_p$ Confidence Sets Gen Li Cong Ma Nathan Srebro OffRL 18 11 0 21 May 2022
When Is Partially Observable Reinforcement Learning Not Scary? Qinghua Liu Alan Chung Csaba Szepesvári Chi Jin 9 92 0 19 Apr 2022
Pessimistic Q-Learning for Offline Reinforcement Learning: Towards Optimal Sample Complexity Laixi Shi Gen Li Yuting Wei Yuxin Chen Yuejie Chi OffRL 11 90 0 28 Feb 2022
Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai Lingxiao Wang Zhuoran Yang Zhihong Deng Animesh Garg Peng Liu Zhaoran Wang OffRL 19 132 0 23 Feb 2022
Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong Wei Xiong Jiyuan Tan Liwei Wang Tong Zhang Zhaoran Wang Zhuoran Yang OffRL 11 37 0 15 Feb 2022
Provable Reinforcement Learning with a Short-Term Memory Yonathan Efroni Chi Jin A. Krishnamurthy Sobhan Miryoosefi OffRL 6 37 0 08 Feb 2022
Adversarially Trained Actor Critic for Offline Reinforcement Learning Ching-An Cheng Tengyang Xie Nan Jiang Alekh Agarwal OffRL 11 124 0 05 Feb 2022
Efficient Reinforcement Learning in Block MDPs: A Model-free Representation Learning Approach Xuezhou Zhang Yuda Song Masatoshi Uehara Mengdi Wang Alekh Agarwal Wen Sun OffRL 11 57 0 31 Jan 2022
Tensor and Matrix Low-Rank Value-Function Approximation in Reinforcement Learning Sergio Rozada Santiago Paternain A. Marques 45 13 0 21 Jan 2022
When is Offline Two-Player Zero-Sum Markov Game Solvable? Qiwen Cui S. Du OffRL 16 29 0 10 Jan 2022
A Free Lunch from the Noise: Provable and Practical Exploration for Representation Learning Tongzheng Ren Tianjun Zhang Csaba Szepesvári Bo Dai 14 19 0 22 Nov 2021
PC-MLP: Model-based Reinforcement Learning with Policy Cover Guided Exploration Yuda Song Wen Sun 30 21 0 15 Jul 2021
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage Masatoshi Uehara Wen Sun OffRL 91 144 0 13 Jul 2021
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL Weitong Zhang Jiafan He Dongruo Zhou Amy Zhang Quanquan Gu OffRL 12 11 0 22 Jun 2021