Is a Good Representation Sufficient for Sample Efficient Reinforcement Learning?

7 October 2019

Papers citing "Is a Good Representation Sufficient for Sample Efficient Reinforcement Learning?"

50 / 152 papers shown

Title
On the Power of Foundation Models Yang Yuan 20 36 0 29 Nov 2022
Linear Reinforcement Learning with Ball Structure Action Space Zeyu Jia Randy Jia Dhruv Madeka Dean Phillips Foster 25 1 0 14 Nov 2022
Contexts can be Cheap: Solving Stochastic Contextual Bandits with Linear Bandit Algorithms Osama A. Hanna Lin F. Yang Christina Fragouli 27 11 0 08 Nov 2022
Optimal Conservative Offline RL with General Function Approximation via Augmented Lagrangian Paria Rashidinejad Hanlin Zhu Kunhe Yang Stuart J. Russell Jiantao Jiao OffRL 45 26 0 01 Nov 2022
Confident Approximate Policy Iteration for Efficient Local Planning in $q^π$ -realizable MDPs Gellert Weisz András Gyorgy Tadashi Kozuno Csaba Szepesvári 20 7 0 27 Oct 2022
Efficient Global Planning in Large MDPs via Stochastic Primal-Dual Optimization Gergely Neu Nneka Okolo 34 6 0 21 Oct 2022
Bilinear Exponential Family of MDPs: Frequentist Regret Bound with Tractable Exploration and Planning Reda Ouhamma D. Basu Odalric-Ambrym Maillard OffRL 19 10 0 05 Oct 2022
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation Xiaoteng Ma Zhipeng Liang Jose H. Blanchet MingWen Liu Li Xia Jiheng Zhang Qianchuan Zhao Zhengyuan Zhou OOD OffRL 41 22 0 14 Sep 2022
Minimax-Optimal Multi-Agent RL in Markov Games With a Generative Model Gen Li Yuejie Chi Yuting Wei Yuxin Chen 32 18 0 22 Aug 2022
Spectral Decomposition Representation for Reinforcement Learning Tongzheng Ren Tianjun Zhang Lisa Lee Joseph E. Gonzalez Dale Schuurmans Bo Dai OffRL 40 27 0 19 Aug 2022
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning Shuang Qiu Lingxiao Wang Chenjia Bai Zhuoran Yang Zhaoran Wang SSL OffRL 26 32 0 29 Jul 2022
A Few Expert Queries Suffices for Sample-Efficient RL with Resets and Linear Value Approximation P. Amortila Nan Jiang Dhruv Madeka Dean Phillips Foster 29 5 0 18 Jul 2022
Instance-Dependent Near-Optimal Policy Identification in Linear MDPs via Online Experiment Design Andrew Wagenmaker Kevin G. Jamieson OffRL 32 25 0 06 Jul 2022
Overcoming the Long Horizon Barrier for Sample-Efficient Reinforcement Learning with Latent Low-Rank Structure Tyler Sam Yudong Chen Chao Yu OffRL 39 6 0 07 Jun 2022
Computationally Efficient Horizon-Free Reinforcement Learning for Linear Mixture MDPs Dongruo Zhou Quanquan Gu 81 43 0 23 May 2022
Data-driven control of spatiotemporal chaos with reduced-order neural ODE-based models and reinforcement learning Kevin Zeng Alec J. Linot M. Graham AI4CE 22 28 0 01 May 2022
Complete Policy Regret Bounds for Tallying Bandits Dhruv Malik Yuanzhi Li Aarti Singh OffRL 23 2 0 24 Apr 2022
Investigating the Properties of Neural Network Representations in Reinforcement Learning Han Wang Erfan Miahi Martha White Marlos C. Machado Zaheer Abbas Raksha Kumaraswamy Vincent Liu Adam White 22 26 0 30 Mar 2022
A Complete Characterization of Linear Estimators for Offline Policy Evaluation Juan C. Perdomo A. Krishnamurthy Peter L. Bartlett Sham Kakade OffRL 27 3 0 08 Mar 2022
Sequential Information Design: Markov Persuasion Process and Its Efficient Reinforcement Learning Jibang Wu Zixuan Zhang Zhe Feng Zhaoran Wang Zhuoran Yang Michael I. Jordan Haifeng Xu 18 33 0 22 Feb 2022
Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong Wei Xiong Jiyuan Tan Liwei Wang Tong Zhang Zhaoran Wang Zhuoran Yang OffRL 27 37 0 15 Feb 2022
Offline Reinforcement Learning with Realizability and Single-policy Concentrability Wenhao Zhan Baihe Huang Audrey Huang Nan Jiang Jason D. Lee OffRL 39 104 0 09 Feb 2022
Reward-Free RL is No Harder Than Reward-Aware RL in Linear Markov Decision Processes Andrew Wagenmaker Yifang Chen Max Simchowitz S. Du Kevin G. Jamieson 19 48 0 26 Jan 2022
First-Order Regret in Reinforcement Learning with Linear Function Approximation: A Robust Estimation Approach Andrew Wagenmaker Yifang Chen Max Simchowitz S. Du Kevin G. Jamieson 73 36 0 07 Dec 2021
Offline Reinforcement Learning: Fundamental Barriers for Value Function Approximation Dylan J. Foster A. Krishnamurthy D. Simchi-Levi Yunzong Xu OffRL 21 62 0 21 Nov 2021
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning Robert Kirk Amy Zhang Edward Grefenstette Tim Rocktaschel OffRL 17 157 0 18 Nov 2021
Misspecified Gaussian Process Bandit Optimization Ilija Bogunovic Andreas Krause 57 42 0 09 Nov 2021
Perturbational Complexity by Distribution Mismatch: A Systematic Analysis of Reinforcement Learning in Reproducing Kernel Hilbert Space Jihao Long Jiequn Han 29 6 0 05 Nov 2021
Convergence and Optimality of Policy Gradient Methods in Weakly Smooth Settings Matthew Shunshi Zhang Murat A. Erdogdu Animesh Garg 16 5 0 30 Oct 2021
Adaptive Discretization in Online Reinforcement Learning Sean R. Sinclair Siddhartha Banerjee Chao Yu OffRL 40 15 0 29 Oct 2021
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection Matteo Papini Andrea Tirinzoni Aldo Pacchiano Marcello Restelli A. Lazaric Matteo Pirotta 19 18 0 27 Oct 2021
Learning Stochastic Shortest Path with Linear Function Approximation Steffen Czolbe Jiafan He Adrian Dalca Quanquan Gu 39 30 0 25 Oct 2021
Representation Learning for Online and Offline RL in Low-rank MDPs Masatoshi Uehara Xuezhou Zhang Wen Sun OffRL 62 127 0 09 Oct 2021
Breaking the Sample Complexity Barrier to Regret-Optimal Model-Free Reinforcement Learning Gen Li Laixi Shi Yuxin Chen Yuejie Chi OffRL 45 51 0 09 Oct 2021
Reinforcement Learning in Reward-Mixing MDPs Jeongyeol Kwon Yonathan Efroni C. Caramanis Shie Mannor 32 15 0 07 Oct 2021
Bad-Policy Density: A Measure of Reinforcement Learning Hardness David Abel Cameron Allen Dilip Arumugam D Ellis Hershkowitz Michael L. Littman Lawson L. S. Wong 26 2 0 07 Oct 2021
TensorPlan and the Few Actions Lower Bound for Planning in MDPs under Linear Realizability of Optimal Value Functions Gellert Weisz Csaba Szepesvári András Gyorgy 17 7 0 05 Oct 2021
Efficient Local Planning with Linear Function Approximation Dong Yin Botao Hao Yasin Abbasi-Yadkori N. Lazić Csaba Szepesvári 32 19 0 12 Aug 2021
Going Beyond Linear RL: Sample Efficient Neural Function Approximation Baihe Huang Kaixuan Huang Sham Kakade Jason D. Lee Qi Lei Runzhe Wang Jiaqi Yang 46 8 0 14 Jul 2021
Adapting to Misspecification in Contextual Bandits Dylan J. Foster Claudio Gentile M. Mohri Julian Zimmert 11 85 0 12 Jul 2021
Bayesian decision-making under misspecified priors with applications to meta-learning Max Simchowitz Christopher Tosh A. Krishnamurthy Daniel J. Hsu Thodoris Lykouris Miroslav Dudík Robert Schapire 40 49 0 03 Jul 2021
On component interactions in two-stage recommender systems Jiri Hron K. Krauth Michael I. Jordan Niki Kilbertus CML LRM 40 31 0 28 Jun 2021
Variance-Aware Off-Policy Evaluation with Linear Function Approximation Yifei Min Tianhao Wang Dongruo Zhou Quanquan Gu OffRL 37 38 0 22 Jun 2021
Provably Efficient Representation Selection in Low-rank Markov Decision Processes: From Online to Offline RL Weitong Zhang Jiafan He Dongruo Zhou Amy Zhang Quanquan Gu OffRL 22 11 0 22 Jun 2021
Agnostic Reinforcement Learning with Low-Rank MDPs and Rich Observations Christoph Dann Yishay Mansour M. Mohri Ayush Sekhari Karthik Sridharan OffRL 16 11 0 22 Jun 2021
Sample Efficient Reinforcement Learning In Continuous State Spaces: A Perspective Beyond Linearity Dhruv Malik Aldo Pacchiano Vishwak Srinivasan Yuanzhi Li 12 6 0 15 Jun 2021
Which Mutual-Information Representation Learning Objectives are Sufficient for Control? Kate Rakelly Abhishek Gupta Carlos Florensa Sergey Levine SSL 26 38 0 14 Jun 2021
Online Sub-Sampling for Reinforcement Learning with General Function Approximation Dingwen Kong Ruslan Salakhutdinov Ruosong Wang Lin F. Yang OffRL 38 1 0 14 Jun 2021
Sublinear Least-Squares Value Iteration via Locality Sensitive Hashing Anshumali Shrivastava Zhao Song Zhaozhuo Xu 19 22 0 18 May 2021
Sample-Efficient Reinforcement Learning Is Feasible for Linearly Realizable MDPs with Limited Revisiting Gen Li Yuxin Chen Yuejie Chi Yuantao Gu Yuting Wei OffRL 26 28 0 17 May 2021