Making Deep Q-learning methods robust to time discretization

A Temporal Difference Method for Stochastic Continuous Dynamics

184

01 Jul 2025

Haruki Settai

Naoya Takeishi

Takehisa Yairi

524

21 May 2025

Accuracy of Discretely Sampled Stochastic Policies in Continuous-time Reinforcement Learning

Synthesis of Model Predictive Control and Reinforcement Learning: Survey and Classification

Du Ouyang

Yufei Zhang

302

13 Mar 2025

323

04 Feb 2025

Action Gaps and Advantages in Continuous-Time Distributional Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2024

170

14 Oct 2024

Exploratory Optimal Stopping: A Singular Control Formulation

Jodi Dianetti

Giorgio Ferrari

Renyuan Xu

219

18 Aug 2024

Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy

314

04 Jul 2024

An Idiosyncrasy of Time-discretization in Reinforcement Learning

Kris De Asis

Richard S. Sutton

219

21 Jun 2024

Reinforcement Learning for Intensity Control: An Application to Choice-Based Network Revenue Management

Huiling Meng

Yi Xiong

Reinforcement Learning for Jump-Diffusions, with Financial Applications

214

08 Jun 2024

Lingfei Li

Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penalty

452

26 May 2024

Approximate Control for Continuous-Time POMDPs

193

19 Apr 2024

Yannick Eich

Bastian Alt

Heinz Koeppl

170

02 Feb 2024

Continuous Time Continuous Space Homeostatic Reinforcement Learning (CTCS-HRRL) : Towards Biological Self-Autonomous Agent

Hugo Laurençon

Yesoda Bhargava

Riddhi Zantye

Charbel-Raphaël Ségerie

J. Lussange

V. Baths

Boris Gutkin

17 Jan 2024

Data-driven rules for multidimensional reflection problems

Soren Christensen

Asbjorn Holk Thomsen

Lukas Trottner

172

11 Nov 2023

Efficient Exploration in Continuous-time Model-based Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

263

30 Oct 2023

Actor-Critic with variable time discretization via sustained actionsInternational Conference on Neural Information Processing (ICONIP), 2023

Jakub Lyskawa

Pawel Wawrzyñski

08 Aug 2023

Policy Optimization for Continuous Reinforcement LearningNeural Information Processing Systems (NeurIPS), 2023

349

30 May 2023

Reducing the Cost of Cycle-Time Tuning for Real-World Policy OptimizationIEEE International Joint Conference on Neural Network (IJCNN), 2023

Homayoon Farrahi

Rupam Mahmood

168

09 May 2023

Managing Temporal Resolution in Continuous Value Estimation: A Fundamental Trade-offNeural Information Processing Systems (NeurIPS), 2022

332

17 Dec 2022

Dynamic Decision Frequency with Continuous OptionsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2022

273

06 Dec 2022

Simultaneously Updating All Persistence Values in Reinforcement LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

Luca Sabbioni

Luca Al Daire

L. Bisi

Alberto Maria Metelli

Marcello Restelli

143

21 Nov 2022

Convergence of policy gradient methods for finite-horizon exploratory linear-quadratic control problemsSIAM Journal of Control and Optimization (SICON), 2022

Michael Giegrich

Christoph Reisinger

Yufei Zhang

322

01 Nov 2022

Square-root regret bounds for continuous-time episodic Markov decision processesMathematics of Operations Research (MOR), 2022

325

03 Oct 2022

Offline Reinforcement Learning at Multiple FrequenciesConference on Robot Learning (CoRL), 2022

216

26 Jul 2022

Adaptive Asynchronous Control Using Meta-learned Neural Ordinary Differential EquationsIEEE Transactions on robotics (TRO), 2022

355

25 Jul 2022

q-Learning in Continuous TimeJournal of machine learning research (JMLR), 2022

490

02 Jul 2022

Distributional Hamilton-Jacobi-Bellman Equations for Continuous-Time Reinforcement LearningInternational Conference on Machine Learning (ICML), 2022

Harley Wiltzer

David Meger

Marc G. Bellemare

182

24 May 2022

Logarithmic regret bounds for continuous-time average-reward Markov decision processesSIAM Journal of Control and Optimization (SICON), 2022

Temporal Difference Learning with Continuous Time and State in the Stochastic Setting

323

23 May 2022

Linear convergence of a policy gradient method for some finite horizon continuous time control problemsSIAM Journal of Control and Optimization (SICON), 2022

C. Reisinger

Wolfgang Stockinger

Yufei Zhang

400

22 Mar 2022

Ziad Kobeissi

Francis R. Bach

241

16 Feb 2022

Policy Gradient and Actor-Critic Learning in Continuous Time and Space: Theory and AlgorithmsJournal of machine learning research (JMLR), 2021

Time Discretization-Invariant Safe Action Repetition for Policy Gradient Methods

373

116

22 Nov 2021

Seohong Park

Jaekyeom Kim

Gunhee Kim

309

06 Nov 2021

Continuous-Time Fitted Value Iteration for Robust Policies

Jan Peters

211

05 Oct 2021

Continuous Homeostatic Reinforcement Learning for Self-Regulated Autonomous Agents

Hugo Laurençon

Charbel-Raphaël Ségerie

J. Lussange

Boris Gutkin

157

14 Sep 2021

A generalized stacked reinforcement learning method for sampled systemsIEEE Transactions on Automatic Control (IEEE TAC), 2021

157

23 Aug 2021

Towards Automatic Actor-Critic Solutions to Continuous Control

149

16 Jun 2021

Time-Aware Q-Networks: Resolving Temporal Irregularity for Deep Reinforcement Learning

Yeonji Kim

Min Chi

110

06 May 2021

ACERAC: Efficient reinforcement learning in fine time discretizationIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

Jakub Łyskawa

Pawel Wawrzyñski

232

08 Apr 2021

Continuous-Time Model-Based Reinforcement LearningInternational Conference on Machine Learning (ICML), 2021

Çağatay Yıldız

Markus Heinonen

Harri Lähdesmäki

234

09 Feb 2021

State-Dependent Temperature Control for Langevin DiffusionsSIAM Journal of Control and Optimization (SICON), 2020

Z. Xu