Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1509.02971
Cited By

Continuous control with deep reinforcement learning

v1v2v3v4v5v6 (latest)

Continuous control with deep reinforcement learning

9 September 2015

Timothy Lillicrap

Jonathan J. Hunt

Alexander Pritzel

David Silver

ArXiv (abs)PDF HTML

Papers citing "Continuous control with deep reinforcement learning"

50 / 4,796 papers shown

Directional Ensemble Aggregation for Actor-Critics

Directional Ensemble Aggregation for Actor-Critics

Bahareh Tasdighi

183

0

0

31 Jul 2025

One-Step Flow Policy Mirror Descent

One-Step Flow Policy Mirror Descent

257

1

0

31 Jul 2025

RL as Regressor: A Reinforcement Learning Approach for Function Approximation

RL as Regressor: A Reinforcement Learning Approach for Function Approximation

17

0

0

31 Jul 2025

Deep Reinforcement Learning in Factor Investment

Deep Reinforcement Learning in Factor Investment

74

0

0

30 Jul 2025

Model Predictive Adversarial Imitation Learning for Planning from Observation

Model Predictive Adversarial Imitation Learning for Planning from Observation

Anubhav Vishwakarma

...

Rosario Scalise

134

1

0

29 Jul 2025

Geometry of Neural Reinforcement Learning in Continuous State and Action Spaces

Geometry of Neural Reinforcement Learning in Continuous State and Action SpacesInternational Conference on Learning Representations (ICLR), 2025

George Konidaris

226

3

0

28 Jul 2025

Spatial-Temporal Reinforcement Learning for Network Routing with Non-Markovian Traffic

Spatial-Temporal Reinforcement Learning for Network Routing with Non-Markovian Traffic

94

0

0

27 Jul 2025

ASNN: Learning to Suggest Neural Architectures from Performance Distributions

ASNN: Learning to Suggest Neural Architectures from Performance Distributions

65

0

0

27 Jul 2025

Observations Meet Actions: Learning Control-Sufficient Representations for Robust Policy Generalization

Observations Meet Actions: Learning Control-Sufficient Representations for Robust Policy Generalization

200

0

0

25 Jul 2025

Simulation-Driven Reinforcement Learning in Queuing Network Routing Optimization

Simulation-Driven Reinforcement Learning in Queuing Network Routing Optimization

40

1

0

24 Jul 2025

From Individual Learning to Market Equilibrium: Correcting Structural and Parametric Biases in RL Simulations of Economic Models

From Individual Learning to Market Equilibrium: Correcting Structural and Parametric Biases in RL Simulations of Economic Models

222

0

0

24 Jul 2025

HARLF: Hierarchical Reinforcement Learning and Lightweight LLM-Driven Sentiment Integration for Financial Portfolio Optimization

HARLF: Hierarchical Reinforcement Learning and Lightweight LLM-Driven Sentiment Integration for Financial Portfolio Optimization

Benjamin Coriat

101

1

0

24 Jul 2025

Confidence Calibration in Vision-Language-Action Models

Confidence Calibration in Vision-Language-Action Models

Thomas P. Zollo

150

1

0

23 Jul 2025

Guided Reinforcement Learning for Omnidirectional 3D Jumping in Quadruped Robots

Guided Reinforcement Learning for Omnidirectional 3D Jumping in Quadruped Robots

Riccardo Bussola

273

2

0

22 Jul 2025

Robust Control with Gradient Uncertainty

Robust Control with Gradient Uncertainty

96

0

0

20 Jul 2025

Federated Reinforcement Learning in Heterogeneous Environments

Federated Reinforcement Learning in Heterogeneous Environments

152

1

0

19 Jul 2025

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Supervised Fine Tuning on Curated Data is Reinforcement Learning (and can be improved)

Jost Tobias Springenberg

209

12

0

17 Jul 2025

Relative Entropy Pathwise Policy Optimization

Relative Entropy Pathwise Policy Optimization

Axel Brunnbauer

Amir-massoud Farahmand

Igor Gilitschenski

369

0

0

15 Jul 2025

Solving dynamic portfolio selection problems via score-based diffusion models

Solving dynamic portfolio selection problems via score-based diffusion models

Erhan Bayraktar

265

2

0

14 Jul 2025

Multimodal Visual Transformer for Sim2real Transfer in Visual Reinforcement Learning

Multimodal Visual Transformer for Sim2real Transfer in Visual Reinforcement Learning

280

0

0

12 Jul 2025

Reinforcement Learning with Action Chunking

Reinforcement Learning with Action Chunking

391

24

0

10 Jul 2025

Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes

Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes

Atsushi Nitanda

371

0

0

29 Jun 2025

An Introduction to Zero-Order Optimization Techniques for Robotics

An Introduction to Zero-Order Optimization Techniques for Robotics

Ludovic Righetti

157

2

0

27 Jun 2025

Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning

Flow-Based Single-Step Completion for Efficient and Expressive Policy Learning

Prajwal Koirala

319

4

0

26 Jun 2025

CyGym: A Simulation-Based Game-Theoretic Analysis Framework for Cybersecurity

CyGym: A Simulation-Based Game-Theoretic Analysis Framework for Cybersecurity

Yevgeniy Vorobeychik

138

1

0

26 Jun 2025

Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning

Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning

Pierre-Luc Bacon

182

6

0

20 Jun 2025

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

CAWR: Corruption-Averse Advantage-Weighted Regression for Robust Policy Optimization

304

0

0

18 Jun 2025

Stable Gradients for Stable Learning at Scale in Deep Reinforcement Learning

Stable Gradients for Stable Learning at Scale in Deep Reinforcement Learning

Roger Creus Castanyer

J. Obando-Ceron

Pierre-Luc Bacon

Aaron Courville

Pablo Samuel Castro

217

4

0

18 Jun 2025

Steering Your Diffusion Policy with Latent Space Reinforcement Learning

Steering Your Diffusion Policy with Latent Space Reinforcement Learning

Andrew Wagenmaker

Mitsuhiko Nakamoto

Anusha Nagabandi

325

26

0

18 Jun 2025

Common Benchmarks Undervalue the Generalization Power of Programmatic Policies

Common Benchmarks Undervalue the Generalization Power of Programmatic Policies

Amirhossein Rajabpour

Kiarash Aghakasiri

Levi H. S. Lelis

186

0

0

17 Jun 2025

Overcoming Overfitting in Reinforcement Learning via Gaussian Process Diffusion Policy

Overcoming Overfitting in Reinforcement Learning via Gaussian Process Diffusion PolicySymposium on Software Performance (SP), 2025

Amornyos Horprasert

Lyudmila S. Mihaylova

147

1

0

16 Jun 2025

Touch begins where vision ends: Generalizable policies for contact-rich manipulation

Touch begins where vision ends: Generalizable policies for contact-rich manipulation

Siddhant Haldar

Raunaq M. Bhirangi

257

4

0

16 Jun 2025

Dynamic Reinsurance Treaty Bidding via Multi-Agent Reinforcement Learning

Dynamic Reinsurance Treaty Bidding via Multi-Agent Reinforcement Learning

James R. Finlay

139

2

0

16 Jun 2025

Similarity as Reward Alignment: Robust and Versatile Preference-based Reinforcement Learning

Similarity as Reward Alignment: Robust and Versatile Preference-based Reinforcement Learning

181

1

0

14 Jun 2025

Palpation Alters Auditory Pain Expressions with Gender-Specific Variations in Robopatients

Palpation Alters Auditory Pain Expressions with Gender-Specific Variations in RobopatientsIEEE Transactions on Medical Robotics and Bionics (TMRB), 2025

Chapa Sirithunge

Saitarun Nadipineni

Thilina Dulantha Lalitharatne

141

0

0

13 Jun 2025

Your Ride, Your Rules: Psychology and Cognition Enabled Automated Driving Systems

Your Ride, Your Rules: Psychology and Cognition Enabled Automated Driving Systems

248

0

0

13 Jun 2025

Wasserstein Barycenter Soft Actor-Critic

Wasserstein Barycenter Soft Actor-Critic

Zahra Shahrooei

278

1

0

11 Jun 2025

GPS Spoofing Attacks on AI-based Navigation Systems with Obstacle Avoidance in UAV

115

1

0

10 Jun 2025

Uncovering the Computational Roles of Nonlinearity in Sequence Modeling Using Almost-Linear RNNs

Uncovering the Computational Roles of Nonlinearity in Sequence Modeling Using Almost-Linear RNNs

203

0

0

09 Jun 2025

Monotone and Conservative Policy Iteration Beyond the Tabular Case

Monotone and Conservative Policy Iteration Beyond the Tabular Case

Ananyabrata Barua

189

1

0

08 Jun 2025

AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification

AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification

299

0

0

06 Jun 2025

Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement Learning

Gradual Transition from Bellman Optimality Operator to Bellman Operator in Online Reinforcement Learning

298

0

0

06 Jun 2025

Dream to Generalize: Zero-Shot Model-Based Reinforcement Learning for Unseen Visual Distractions

Dream to Generalize: Zero-Shot Model-Based Reinforcement Learning for Unseen Visual DistractionsAAAI Conference on Artificial Intelligence (AAAI), 2023

177

10

0

05 Jun 2025

When Maximum Entropy Misleads Policy Optimization

When Maximum Entropy Misleads Policy Optimization

167

6

0

05 Jun 2025

An Efficient Task-Oriented Dialogue Policy: Evolutionary Reinforcement Learning Injected by Elite Individuals

An Efficient Task-Oriented Dialogue Policy: Evolutionary Reinforcement Learning Injected by Elite IndividualsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

242

3

0

04 Jun 2025

Autonomous Vehicle Lateral Control Using Deep Reinforcement Learning with MPC-PID Demonstration

Autonomous Vehicle Lateral Control Using Deep Reinforcement Learning with MPC-PID Demonstration

172

2

0

04 Jun 2025

A Novel Deep Reinforcement Learning Method for Computation Offloading in Multi-User Mobile Edge Computing with Decentralization

A Novel Deep Reinforcement Learning Method for Computation Offloading in Multi-User Mobile Edge Computing with DecentralizationInternational Conference on Autonomic and Trusted Computing (ATC), 2024

Nguyen Chi Long

Trinh Van Chien

Trong-Minh Hoang

Nguyen Ngoc Hai Dang

126

0

0

03 Jun 2025

Data-assimilated model-informed reinforcement learning

Data-assimilated model-informed reinforcement learning

316

1

0

02 Jun 2025

Bidirectional Soft Actor-Critic: Leveraging Forward and Reverse KL Divergence for Efficient Reinforcement Learning

Bidirectional Soft Actor-Critic: Leveraging Forward and Reverse KL Divergence for Efficient Reinforcement Learning

174

0

0

02 Jun 2025

Optimistic critics can empower small actors

Optimistic critics can empower small actors

Olya Mastikhina

Dhruv Sreenivas

Pablo Samuel Castro

517

3

0

01 Jun 2025

1 2 3 4 5 6...94 95 96