v1v2v3v4 (latest)

Logarithmic regret for episodic continuous-time linear-quadratic reinforcement learning over a finite-time horizon

27 June 2020

Papers citing "Logarithmic regret for episodic continuous-time linear-quadratic reinforcement learning over a finite-time horizon"

27 / 27 papers shown

Continuous-Time Reinforcement Learning for Asset-Liability Management

Yilie Huang

136

27 Sep 2025

Instance-Dependent Continuous-Time Reinforcement Learning via Maximum Likelihood Estimation

268

04 Aug 2025

Sample and Computationally Efficient Continuous-Time Reinforcement Learning with General Function ApproximationConference on Uncertainty in Artificial Intelligence (UAI), 2025

293

20 May 2025

Accuracy of Discretely Sampled Stochastic Policies in Continuous-time Reinforcement Learning

Yanwei Jia

Du Ouyang

Yufei Zhang

433

13 Mar 2025

Learning to steer with Brownian noise

231

04 Oct 2024

On the Effect of Instability on Learning Continuous-Time Linear Control SystemsAmerican Control Conference (ACC), 2024

Reza Sadeghi Hafshejani

Mohamad Kazem Shirani Fradonbeh

274

17 Sep 2024

Exploratory Optimal Stopping: A Singular Control Formulation

Jodi Dianetti

Giorgio Ferrari

Renyuan Xu

328

18 Aug 2024

ε

-Policy Gradient for Online Pricing

Lukasz Szpruch

Tanut Treetanthiploet

Yufei Zhang

OffRL

282

06 May 2024

Fast Policy Learning for Linear Quadratic Control with Entropy Regularization

Xin Guo

Xinyu Li

Renyuan Xu

499

23 Nov 2023

Data-driven rules for multidimensional reflection problems

Soren Christensen

Asbjorn Holk Thomsen

Lukas Trottner

237

11 Nov 2023

Efficient Exploration in Continuous-time Model-based Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

301

30 Oct 2023

Policy Optimization for Continuous Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

472

30 May 2023

Statistical Learning with Sublinear Regret of Propagator ModelsSocial Science Research Network (SSRN), 2023

Eyal Neuman

Yufei Zhang

406

12 Jan 2023

Managing Temporal Resolution in Continuous Value Estimation: A Fundamental Trade-offNeural Information Processing Systems (NeurIPS), 2022

377

17 Dec 2022

Square-root regret bounds for continuous-time episodic Markov decision processesMathematics of Operations Research (MOR), 2022

Ningyuan Chen

X. Zhou

431

03 Oct 2022

Optimal scheduling of entropy regulariser for continuous-time linear-quadratic reinforcement learning

Lukasz Szpruch

Tanut Treetanthiploet

Yufei Zhang

416

08 Aug 2022

Analysis of Thompson Sampling for Controlling Unknown Linear Diffusion Processes

Mohamad Kazem Shirani Faradonbeh

Sadegh Shirani

Mohsen Bayati

230

20 Jun 2022

Regret Analysis of Certainty Equivalence Policies in Continuous-Time Linear-Quadratic SystemsInternational Conference on System Theory, Control and Computing (ICSTCC), 2022

Mohamad Kazem Shirani Faradonbeh

162

09 Jun 2022

Logarithmic regret bounds for continuous-time average-reward Markov decision processesSIAM Journal of Control and Optimization (SICON), 2022

Ningyuan Chen

X. Zhou

369

23 May 2022

Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time SystemsIFAC-PapersOnLine (IFAC-PapersOnLine), 2021

Mohamad Kazem Shirani Faradonbeh

Mohamad Sadegh Shirani Faradonbeh

139

30 Dec 2021

Exploration-exploitation trade-off for continuous-time episodic reinforcement learning with linear-convex models

Lukasz Szpruch

Tanut Treetanthiploet

Yufei Zhang

237

19 Dec 2021

Recent Advances in Reinforcement Learning in Finance

630

269

08 Dec 2021

Policy Gradient and Actor-Critic Learning in Continuous Time and Space: Theory and AlgorithmsJournal of machine learning research (JMLR), 2021

Yanwei Jia

X. Zhou

OffRL

524

134

22 Nov 2021

Reinforcement Learning Policies in Continuous-Time Linear Systems

Mohamad Kazem Shirani Faradonbeh

Mohamad Sadegh Shirani Faradonbeh

221

16 Sep 2021

Policy Gradient Methods Find the Nash Equilibrium in N-player General-sum Linear-quadratic GamesJournal of machine learning research (JMLR), 2021

B. Hambly

Renyuan Xu

Huining Yang

347

27 Jul 2021

Reinforcement Learning for Adaptive Optimal Stationary Control of Linear Stochastic SystemsIEEE Transactions on Automatic Control (IEEE TAC), 2021

Bo Pang

Zhong-Ping Jiang

245

16 Jul 2021

Reinforcement learning for linear-convex models with jumps via stability analysis of feedback controlsSIAM Journal of Control and Optimization (SICON), 2021

Xin Guo

Anran Hu

Yufei Zhang

279

19 Apr 2021