Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1509.02971
Cited By

Continuous control with deep reinforcement learning

v1v2v3v4v5v6 (latest)

Continuous control with deep reinforcement learning

9 September 2015

Timothy Lillicrap

Jonathan J. Hunt

Alexander Pritzel

David Silver

ArXiv (abs)PDF HTML

Papers citing "Continuous control with deep reinforcement learning"

50 / 4,796 papers shown

CDE: Curiosity-Driven Exploration for Efficient Reinforcement Learning in Large Language Models

CDE: Curiosity-Driven Exploration for Efficient Reinforcement Learning in Large Language Models

...

180

10

0

11 Sep 2025

Curriculum-Based Multi-Tier Semantic Exploration via Deep Reinforcement Learning

Curriculum-Based Multi-Tier Semantic Exploration via Deep Reinforcement Learning

Abdel Hakim Drid

Vincenzo Suriani

Abderrezzak Debilou

128

0

0

11 Sep 2025

Decoding RobKiNet: Insights into Efficient Training of Robotic Kinematics Informed Neural Network

Decoding RobKiNet: Insights into Efficient Training of Robotic Kinematics Informed Neural Network

Chuangchuang Zhou

172

0

0

09 Sep 2025

Fault Tolerant Control of a Quadcopter using Reinforcement Learning

Fault Tolerant Control of a Quadcopter using Reinforcement LearningSAE International Journal of Aerospace (JSA), 2025

Adnan Fayyaz ud Din

36

2

0

09 Sep 2025

Reinforcement learning meets bioprocess control through behaviour cloning: Real-world deployment in an industrial photobioreactor

Reinforcement learning meets bioprocess control through behaviour cloning: Real-world deployment in an industrial photobioreactor

Ehecatl Antonio Del Rio Chanona

José L. Guzmán

Manuel Berenguel

99

2

0

08 Sep 2025

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

Reinforcement Learning with Anticipation: A Hierarchical Approach for Long-Horizon Tasks

75

1

0

06 Sep 2025

QCA-MolGAN: Quantum Circuit Associative Molecular GAN with Multi-Agent Reinforcement Learning

QCA-MolGAN: Quantum Circuit Associative Molecular GAN with Multi-Agent Reinforcement Learning

Aaron Mark Thomas

Hubert Okadome Valencia

Sharu Theresa Jose

246

0

0

05 Sep 2025

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Solving Robotics Tasks with Prior Demonstration via Exploration-Efficient Deep Reinforcement Learning

Chengyandan Shen

Christoffer Sloth

114

0

0

04 Sep 2025

Uncertainty-driven Adaptive Exploration

Uncertainty-driven Adaptive Exploration

Leonidas Bakopoulos

Georgios Chalkiadakis

190

0

0

03 Sep 2025

A Hierarchical Deep Reinforcement Learning Framework for Traffic Signal Control with Predictable Cycle Planning

A Hierarchical Deep Reinforcement Learning Framework for Traffic Signal Control with Predictable Cycle Planning

107

0

0

03 Sep 2025

Autonomous Learning From Success and Failure: Goal-Conditioned Supervised Learning with Negative Feedback

Autonomous Learning From Success and Failure: Goal-Conditioned Supervised Learning with Negative Feedback

Fabian Wurzberger

Sebastian Gottwald

Daniel A. Braun

224

0

0

03 Sep 2025

DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features

DUViN: Diffusion-Based Underwater Visual Navigation via Knowledge-Transferred Depth Features

127

1

0

03 Sep 2025

A Comprehensive Review of Multi-Agent Reinforcement Learning in Video Games

A Comprehensive Review of Multi-Agent Reinforcement Learning in Video GamesIEEE Transactions on Games (IEEE Trans. Games), 2025

138

27

0

03 Sep 2025

Imitate Optimal Policy: Prevail and Induce Action Collapse in Policy Gradient

Imitate Optimal Policy: Prevail and Induce Action Collapse in Policy Gradient

Ben Athiwaratkun

Shuaiwen Leon Song

165

0

0

02 Sep 2025

Power Grid Control with Graph-Based Distributed Reinforcement Learning

Power Grid Control with Graph-Based Distributed Reinforcement Learning

Gianvito Losapio

Alberto Maria Metelli

Marcello Restelli

112

1

0

02 Sep 2025

Towards Scalable O-RAN Resource Management: Graph-Augmented Proximal Policy Optimization

Towards Scalable O-RAN Resource Management: Graph-Augmented Proximal Policy Optimization

Kandaraj Piamrat

Philippe Raipin-Parvédy

93

0

0

01 Sep 2025

Jacobian Exploratory Dual-Phase Reinforcement Learning for Dynamic Endoluminal Navigation of Deformable Continuum Robots

Jacobian Exploratory Dual-Phase Reinforcement Learning for Dynamic Endoluminal Navigation of Deformable Continuum Robots

100

0

0

30 Aug 2025

Gray-Box Computed Torque Control for Differential-Drive Mobile Robot Tracking

Gray-Box Computed Torque Control for Differential-Drive Mobile Robot Tracking

Arman Javan Sekhavat Pishkhani

66

0

0

30 Aug 2025

First Order Model-Based RL through Decoupled Backpropagation

First Order Model-Based RL through Decoupled Backpropagation

Rooholla Khorrambakht

Elliot Chane-Sane

Nicolas Mansard

Ludovic Righetti

161

1

0

29 Aug 2025

DynaMark: A Reinforcement Learning Framework for Dynamic Watermarking in Industrial Machine Tool Controllers

DynaMark: A Reinforcement Learning Framework for Dynamic Watermarking in Industrial Machine Tool Controllers

Abhishek Hanchate

Satish T.S. Bukkapatnam

36

0

0

29 Aug 2025

Task Allocation for Autonomous Machines using Computational Intelligence and Deep Reinforcement Learning

Task Allocation for Autonomous Machines using Computational Intelligence and Deep Reinforcement Learning

Quoc Viet Hung Nguyen

87

0

0

28 Aug 2025

Energy-Efficient Learning-Based Beamforming for ISAC-Enabled V2X Networks

Energy-Efficient Learning-Based Beamforming for ISAC-Enabled V2X Networks

Dinh Thai Hoang

56

0

0

27 Aug 2025

Language Models For Generalised PDDL Planning: Synthesising Sound and Programmatic Policies

Language Models For Generalised PDDL Planning: Synthesising Sound and Programmatic Policies

Tristan Cinquin

Sheila A. McIlraith

178

2

0

25 Aug 2025

Breaking Through Barren Plateaus: Reinforcement Learning Initializations for Deep Variational Quantum Circuits

Breaking Through Barren Plateaus: Reinforcement Learning Initializations for Deep Variational Quantum Circuits

Samuel Yen-Chi Chen

125

0

0

25 Aug 2025

KL-Regularised Q-Learning: A Token-level Action-Value perspective on Online RLHF

KL-Regularised Q-Learning: A Token-level Action-Value perspective on Online RLHF

Jason Ross Brown

Edward James Young

Sergio Bacallado

72

0

0

23 Aug 2025

Reinforcement Learning-based Control via Y-wise Affine Neural Networks (YANNs)

Reinforcement Learning-based Control via Y-wise Affine Neural Networks (YANNs)

77

0

0

22 Aug 2025

FedRAIN-Lite: Federated Reinforcement Algorithms for Improving Idealised Numerical Weather and Climate Models

FedRAIN-Lite: Federated Reinforcement Algorithms for Improving Idealised Numerical Weather and Climate Models

Pritthijit Nath

Sebastian Schemm

Emily Shuckburgh

125

0

0

19 Aug 2025

Categorical Policies: Multimodal Policy Learning and Exploration in Continuous Control

Categorical Policies: Multimodal Policy Learning and Exploration in Continuous Control

SM Mazharul Islam

106

0

0

19 Aug 2025

Straggler-Resilient Federated Learning over A Hybrid Conventional and Pinching Antenna Network

Straggler-Resilient Federated Learning over A Hybrid Conventional and Pinching Antenna Network

50

2

0

17 Aug 2025

Beyond Fixed Morphologies: Learning Graph Policies with Trust Region Compensation in Variable Action Spaces

Beyond Fixed Morphologies: Learning Graph Policies with Trust Region Compensation in Variable Action Spaces

112

0

0

16 Aug 2025

Actor-Critic for Continuous Action Chunks: A Reinforcement Learning Framework for Long-Horizon Robotic Manipulation with Sparse Reward

Actor-Critic for Continuous Action Chunks: A Reinforcement Learning Framework for Long-Horizon Robotic Manipulation with Sparse Reward

85

1

0

15 Aug 2025

Learn to Memorize: Optimizing LLM-based Agents with Adaptive Memory Framework

Learn to Memorize: Optimizing LLM-based Agents with Adaptive Memory Framework

109

6

0

15 Aug 2025

Physics-Informed Reward Machines

Physics-Informed Reward Machines

Ashutosh Trivedi

102

0

0

14 Aug 2025

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

Integrating Reinforcement Learning with Visual Generative Models: Foundations and Advances

315

2

0

14 Aug 2025

Goal Discovery with Causal Capacity for Efficient Reinforcement Learning

Goal Discovery with Causal Capacity for Efficient Reinforcement Learning

136

0

0

13 Aug 2025

SegDAC: Improving Visual Reinforcement Learning by Extracting Dynamic Object-Centric Representations from Pretrained Vision Models

SegDAC: Improving Visual Reinforcement Learning by Extracting Dynamic Object-Centric Representations from Pretrained Vision Models

Alexandre Brown

202

0

0

12 Aug 2025

Deep Reinforcement Learning for Optimal Asset Allocation Using DDPG with TiDE

Deep Reinforcement Learning for Optimal Asset Allocation Using DDPG with TiDE

65

0

0

12 Aug 2025

Optimization of Private Semantic Communication Performance: An Uncooperative Covert Communication Method

Optimization of Private Semantic Communication Performance: An Uncooperative Covert Communication MethodIEEE Transactions on Wireless Communications (TWC), 2025

125

1

0

11 Aug 2025

Pref-GUIDE: Continual Policy Learning from Real-Time Human Feedback via Preference-Based Learning

Pref-GUIDE: Continual Policy Learning from Real-Time Human Feedback via Preference-Based Learning

207

1

0

10 Aug 2025

Natural Language-Driven Viewpoint Navigation for Volume Exploration via Semantic Block Representation

Natural Language-Driven Viewpoint Navigation for Volume Exploration via Semantic Block Representation

99

0

0

09 Aug 2025

Consensus-based Decentralized Multi-agent Reinforcement Learning for Random Access Network Optimization

Consensus-based Decentralized Multi-agent Reinforcement Learning for Random Access Network Optimization

Alvaro Velasquez

75

2

0

09 Aug 2025

Hierarchical Deep Deterministic Policy Gradient for Autonomous Maze Navigation of Mobile Robots

Hierarchical Deep Deterministic Policy Gradient for Autonomous Maze Navigation of Mobile Robots

108

1

0

07 Aug 2025

Scaling DRL for Decision Making: A Survey on Data, Network, and Training Budget Strategies

Scaling DRL for Decision Making: A Survey on Data, Network, and Training Budget Strategies

177

0

0

05 Aug 2025

Comparing Normalization Methods for Portfolio Optimization with Reinforcement Learning

Comparing Normalization Methods for Portfolio Optimization with Reinforcement Learning

Caio de Souza Barbosa Costa

Anna Helena Reali Costa

54

0

0

05 Aug 2025

HALO: Hindsight-Augmented Learning for Online Auto-Bidding

HALO: Hindsight-Augmented Learning for Online Auto-Bidding

161

0

0

05 Aug 2025

Instance-Dependent Continuous-Time Reinforcement Learning via Maximum Likelihood Estimation

Instance-Dependent Continuous-Time Reinforcement Learning via Maximum Likelihood Estimation

166

0

0

04 Aug 2025

MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving

MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving

282

0

0

04 Aug 2025

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?

Is Exploration or Optimization the Problem for Deep Reinforcement Learning?

154

1

0

02 Aug 2025

Centralized Adaptive Sampling for Reliable Co-Training of Independent Multi-Agent Policies

Centralized Adaptive Sampling for Reliable Co-Training of Independent Multi-Agent Policies

Nicholas Corrado

Josiah P. Hanna

153

0

0

01 Aug 2025

OID-PPO: Optimal Interior Design using Proximal Policy Optimization by Transforming Design Guidelines into Reward Functions

OID-PPO: Optimal Interior Design using Proximal Policy Optimization by Transforming Design Guidelines into Reward Functions

53

0

0

01 Aug 2025

1 2 3 4 5...94 95 96