v1v2v3v4v5v6 (latest)

Continuous control with deep reinforcement learning

9 September 2015

Alexander Pritzel

David Silver

Papers citing "Continuous control with deep reinforcement learning"

50 / 4,796 papers shown

Continual Knowledge Adaptation for Reinforcement Learning

195

21 Jan 2026

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

307

21 Jan 2026

Diffusion Fine-Tuning via Reparameterized Policy Gradient of the Soft Q-Function

101

04 Dec 2025

Deep Reinforcement Learning for Dynamic Algorithm Configuration: A Case Study on Optimizing OneMax with the (1+(

λ

λ

03 Dec 2025

Guided Flow Policy: Learning from High-Value Actions in Offline Reinforcement Learning

Franki Nguimatsia Tiofack

Théotime Le Hellard

Fabian Schramm

Nicolas Perrin-Gilbert

Justin Carpentier

242

03 Dec 2025

World Models for Autonomous Navigation of Terrestrial Robots from LIDAR Observations

378

03 Dec 2025

GoRL: An Algorithm-Agnostic Framework for Online Reinforcement Learning with Generative Policies

02 Dec 2025

How Market Volatility Shapes Algorithmic Collusion: A Comparative Analysis of Learning-Based Pricing Algorithms

01 Dec 2025

How do trout regulate patterns of muscle contraction to optimize propulsive efficiency during steady swimming

01 Dec 2025

On the Tension Between Optimality and Adversarial Robustness in Policy Optimization

139

01 Dec 2025

Forecasting in Offline Reinforcement Learning for Non-stationary Environments

169

01 Dec 2025

Hardware-Software Collaborative Computing of Photonic Spiking Reinforcement Learning for Robotic Continuous Control

29 Nov 2025

Algorithmic Guarantees for Distilling Supervised and Offline RL Datasets

184

29 Nov 2025

Fault-Tolerant MARL for CAVs under Observation Perturbations for Highway On-Ramp Merging

224

28 Nov 2025

Safe and Sustainable Electric Bus Charging Scheduling with Constrained Hierarchical DRLIEEE Transactions on Vehicular Technology (IEEE Trans. Veh. Technol.), 2025

25 Nov 2025

Reinforcing Action Policies by Prophesying

233

25 Nov 2025

Learning Massively Multitask World Models for Continuous Control

529

24 Nov 2025

FastForward Pruning: Efficient LLM Pruning via Single-Step Reinforcement Learning

373

24 Nov 2025

Multi-Agent Cross-Entropy Method with Monotonic Nonlinear Critic Decomposition

Yan Wang

Ke Deng

Yongli Ren

159

24 Nov 2025

First-order Sobolev Reinforcement Learning

Fabian Schramm

Nicolas Perrin-Gilbert

Justin Carpentier

24 Nov 2025

General Agentic Memory Via Deep Research

23 Nov 2025

A Reinforcement Learning Framework for Resource Allocation in Uplink Carrier Aggregation in the Presence of Self InterferenceIEEE Transactions on Machine Learning in Communications and Networking (IEEE TMLCN), 2025

Ananthanarayanan Chockalingam

22 Nov 2025

MOMA-AC: A preference-driven actor-critic framework for continuous multi-objective multi-agent reinforcement learningNeurocomputing (Neurocomputing), 2025

22 Nov 2025

Limitations of Scalarisation in MORL: A Comparative Study in Discrete Environments

Muhammad Saóod Shah

Asad Jeewa

138

20 Nov 2025

Stabilizing Policy Gradient Methods via Reward Profiling

204

20 Nov 2025

Mitigating Estimation Bias with Representation Learning in TD Error-Driven Regularization

127

20 Nov 2025

Revisiting Fairness-aware Interactive Recommendation: Item Lifecycle as a Control Knob

20 Nov 2025

A Hybrid Proactive And Predictive Framework For Edge Cloud Resource Management

180

20 Nov 2025

Socially aware navigation for mobile robots: a survey on deep reinforcement learning approaches

Ibrahim Khalil Kabir

Muhammad Faizan Mysorewala

18 Nov 2025

DeepSport: A Multimodal Large Language Model for Comprehensive Sports Video Reasoning via Agentic Reinforcement Learning

168

17 Nov 2025

NFQ2.0: The CartPole Benchmark Revisited

Sascha Lange

Roland Hafner

Martin Riedmiller

16 Nov 2025

Reinforcement Learning for Charging Optimization of Inhomogeneous Dicke Quantum Batteries

15 Nov 2025

Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams

15 Nov 2025

Deep Reinforcement Learning for Automated Stock Trading: An Ensemble StrategyInternational Conference on AI in Finance (ICAIF), 2020

288

270

15 Nov 2025

DemoTuner: Automatic Performance Tuning for Database Management Systems Based on Demonstration Reinforcement Learning

Zibin Zheng

233

13 Nov 2025

Dynamic Sparsity: Challenging Common Sparsity Assumptions for Learning World Models in Robotic Reinforcement Learning Benchmarks

200

11 Nov 2025

PrefPoE: Advantage-Guided Preference Fusion for Learning Where to Explore

125

11 Nov 2025

Statistically Assuring Safety of Control Systems using Ensembles of Safety Filters and Conformal Prediction

Ihab Tabbara

Yuxuan Yang

Hussein Sibai

128

11 Nov 2025

Multistep Quasimetric Learning for Scalable Goal-conditioned Reinforcement Learning

194

11 Nov 2025

On Geometric Structures for Policy Parameterization in Continuous Control

Zhihao Lin

247

11 Nov 2025

Enabling Off-Policy Imitation Learning with Deep Actor Critic Stabilization

Sayambhu Sen

Shalabh Bhatnagar

101

10 Nov 2025

Shocks Under Control: Taming Transonic Compressible Flow over an RAE2822 Airfoil with Deep Reinforcement Learning

103

10 Nov 2025

Cross-Platform Learnable Fuzzy Gain-Scheduled Proportional-Integral-Derivative Controller Tuning via Physics-Constrained Meta-Learning and Reinforcement Learning Adaptation

JiaHao Wu

ShengWen Yu

AI4CE

313

09 Nov 2025

Towards Personalized Quantum Federated Learning for Anomaly DetectionIEEE Transactions on Network Science and Engineering (IEEE TNS&E), 2025

Ratun Rahman

Sina shaham

Dinh C. Nguyen

164

08 Nov 2025

Distributionally Robust Self Paced Curriculum Reinforcement Learning

496

07 Nov 2025

Imitation Learning in the Deep Learning Era: A Novel Taxonomy and Recent Advances

Iason Chrysomallis

Georgios Chalkiadakis

OOD

240

05 Nov 2025

Tensor-Efficient High-Dimensional Q-learning

Junyi Wu

Dan Li

OffRL

05 Nov 2025

Going Beyond Expert Performance via Deep Implicit Imitation Reinforcement Learning

Iason Chrysomallis

Georgios Chalkiadakis

OffRL

128

05 Nov 2025

Curriculum Design for Trajectory-Constrained Agent: Compressing Chain-of-Thought Tokens in LLMs

Georgios Tzannetos

Parameswaran Kamalaruban

Adish Singla

148

04 Nov 2025

Optimizing Electric Vehicle Charging Station Placement Using Reinforcement Learning and Agent-Based Simulations

Minh-Duc Nguyen

Dung D. Le

Phi Long Nguyen

03 Nov 2025