v1v2 (latest)

Reinforcement Learning in Feature Space: Matrix Bandit, Kernels, and Regret Bound

International Conference on Machine Learning (ICML), 2019

24 May 2019

Papers citing "Reinforcement Learning in Feature Space: Matrix Bandit, Kernels, and Regret Bound"

50 / 226 papers shown

Distributionally Robust Online Markov Game with Linear Function Approximation

Zewu Zheng

Yuanyuan Lin

OOD OffRL

284

11 Nov 2025

Reinforcement Learning Using known Invariances

120

05 Nov 2025

No-Regret Thompson Sampling for Finite-Horizon Markov Decision Processes with Gaussian Processes

116

23 Oct 2025

Generalized Kernelized Bandits: A Novel Self-Normalized Bernstein-Like Dimension-Free Inequality and Regret Bounds

Alberto Maria Metelli

Simone Drago

Marco Mussi

121

03 Aug 2025

Statistical and Algorithmic Foundations of Reinforcement Learning

209

19 Jul 2025

Learning Task-Agnostic Motifs to Capture the Continuous Nature of Animal Behavior

165

18 Jun 2025

The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability

213

11 Jun 2025

Generalized Linear Markov Decision Process

208

01 Jun 2025

Provably Efficient Reinforcement Learning with Multinomial Logit Function ApproximationNeural Information Processing Systems (NeurIPS), 2024

500

17 Jan 2025

Efficient, Low-Regret, Online Reinforcement Learning for Linear MDPs

218

16 Nov 2024

Demystifying Linear MDPs and Novel Dynamics Aggregation FrameworkInternational Conference on Learning Representations (ICLR), 2024

Joongkyu Lee

Min-hwan Oh

213

31 Oct 2024

Primal-Dual Spectral Representation for Off-policy EvaluationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

274

23 Oct 2024

Learning Infinite-Horizon Average-Reward Linear Mixture MDPs of Bounded SpanInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

173

19 Oct 2024

Neural Combinatorial Clustered Bandits for Recommendation SystemsAAAI Conference on Artificial Intelligence (AAAI), 2024

Baran Atalar

Carlee Joe-Wong

CML OffRL

164

18 Oct 2024

Upper and Lower Bounds for Distributionally Robust Off-Dynamics Reinforcement Learning

Zhishuai Liu

Weixin Wang

Pan Xu

360

30 Sep 2024

BECAUSE: Bilinear Causal Representation for Generalizable Offline Model-based Reinforcement Learning

Ding Zhao

477

15 Jul 2024

Spectral Representation for Causal Estimation with Hidden Confounders

Arthur Gretton

247

15 Jul 2024

Diffusion Spectral Representation for Reinforcement Learning

Bo Dai

328

23 Jun 2024

More Efficient Randomized Exploration for Reinforcement Learning via Approximate Sampling

Jianfeng Lu

A. Rupam Mahmood

Doina Precup

Pan Xu

182

18 Jun 2024

Linear Bellman Completeness Suffices for Efficient Online Reinforcement Learning with Few Actions

Noah Golowich

Ankur Moitra

OffRL

253

17 Jun 2024

Graph Neural Thompson Sampling

Shuang Wu

Arash A. Amini

350

15 Jun 2024

Pretraining Decision Transformers with Reward Prediction for In-Context Multi-task Structured Bandit Learning

620

07 Jun 2024

Bayesian Design Principles for Offline-to-Online Reinforcement Learning

Changjie Fan

235

31 May 2024

Efficient Duple Perturbation Robustness in Low-rank MDPs

Yang Hu

Haitong Ma

Bo Dai

Na Li

173

11 Apr 2024

Skill Transfer and Discovery for Sim-to-Real Learning: A Representation-Based Viewpoint

Haitong Ma

Tongzheng Ren

Bo Dai

Na Li

188

07 Apr 2024

Sample Complexity of Offline Distributionally Robust Linear Markov Decision Processes

395

19 Mar 2024

RL in Markov Games with Independent Function Approximation: Improved Sample Complexity Bound under the Local Access ModelInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

421

18 Mar 2024

Distributionally Robust Off-Dynamics Reinforcement Learning: Provable Efficiency with Linear Function Approximation

Zhishuai Liu

Pan Xu

OOD OffRL

272

23 Feb 2024

Double Duality: Variational Primal-Dual Policy Optimization for Constrained Reinforcement Learning

Mengdi Wang

293

16 Feb 2024

Towards Robust Model-Based Reinforcement Learning Against Adversarial Corruption

Chen Ye

Jiafan He

Quanquan Gu

Tong Zhang

283

14 Feb 2024

Refined Sample Complexity for Markov Games with Independent Linear Function ApproximationAnnual Conference Computational Learning Theory (COLT), 2024

Yan Dai

Qiwen Cui

S. S. Du

334

11 Feb 2024

Information-Theoretic State Variable Selection for Reinforcement Learning

Charles Westphal

Stephen Hailes

Mirco Musolesi

231

21 Jan 2024

Long-term Safe Reinforcement Learning with Binary FeedbackAAAI Conference on Artificial Intelligence (AAAI), 2024

354

08 Jan 2024

Tree Search-Based Evolutionary Bandits for Protein Sequence OptimizationAAAI Conference on Artificial Intelligence (AAAI), 2024

Hui Yuan

Mengdi Wang

206

08 Jan 2024

Risk-sensitive Markov Decision Process and Learning under General Utility FunctionsSocial Science Research Network (SSRN), 2023

Zhengqi Wu

Renyuan Xu

204

22 Nov 2023

Provable Representation with Efficient Planning for Partial Observable Reinforcement LearningInternational Conference on Machine Learning (ICML), 2023

385

20 Nov 2023

Data-Guided Regulator for Adaptive Nonlinear Control

Niyousha Rahimi

M. Mesbahi

216

20 Nov 2023

Low-Rank MDPs with Continuous Action SpacesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Andrew Bennett

Nathan Kallus

Miruna Oprescu

253

06 Nov 2023

Posterior Sampling with Delayed Feedback for Reinforcement Learning with Linear Function ApproximationNeural Information Processing Systems (NeurIPS), 2023

Nikki Lijing Kuang

Ming Yin

Mengdi Wang

Yu Wang

Yian Ma

289

29 Oct 2023

Unsupervised Behavior Extraction via Random Intent PriorsNeural Information Processing Systems (NeurIPS), 2023

265

28 Oct 2023

Uncertainty-aware transfer across tasks using hybrid model-based successor feature reinforcement learning

Parvin Malekzadeh

Ming Hou

Konstantinos N. Plataniotis

286

16 Oct 2023

Bi-Level Offline Policy Optimization with Limited ExplorationNeural Information Processing Systems (NeurIPS), 2023

Wenzhuo Zhou

OffRL

287

10 Oct 2023

Pessimistic Nonlinear Least-Squares Value Iteration for Offline Reinforcement LearningInternational Conference on Learning Representations (ICLR), 2023

Qiwei Di

Heyang Zhao

Jiafan He

Quanquan Gu

OffRL

229

02 Oct 2023

Reason for Future, Act for Now: A Principled Framework for Autonomous LLM Agents with Provable Sample Efficiency

496

29 Sep 2023

Stackelberg Batch Policy Learning

Wenzhuo Zhou

Annie Qu

OffRL

258

28 Sep 2023

Rate-Optimal Policy Optimization for Linear Markov Decision ProcessesInternational Conference on Machine Learning (ICML), 2023

383

28 Aug 2023

Model-based Offline Reinforcement Learning with Count-based ConservatismInternational Conference on Machine Learning (ICML), 2023

Byeongchang Kim

Min Hwan Oh

OffRL

183

21 Jul 2023

Online Network Source Optimization with Graph-Kernel MAB

Laura Toni

P. Frossard

317

07 Jul 2023

Sequential Neural Barriers for Scalable Dynamic Obstacle AvoidanceIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

223

06 Jul 2023

Provably Efficient Iterated CVaR Reinforcement Learning with Function Approximation and Human FeedbackInternational Conference on Learning Representations (ICLR), 2023

329

06 Jul 2023