v1v2v3v4v5v6 (latest)

Continuous control with deep reinforcement learning

9 September 2015

Alexander Pritzel

David Silver

Papers citing "Continuous control with deep reinforcement learning"

50 / 4,796 papers shown

Hierarchical Reinforcement Learning for Air-to-Air CombatInternational Conference on Unmanned Aircraft Systems (ICUAS), 2021

115

03 May 2021

Generative Adversarial Reward Learning for Generalized Behavior Tendency InferenceIEEE Transactions on Knowledge and Data Engineering (TKDE), 2021

165

03 May 2021

Action Candidate Based Clipped Double Q-learning for Discrete and Continuous Action TasksAAAI Conference on Artificial Intelligence (AAAI), 2021

127

03 May 2021

Learning to drive from a world on railsIEEE International Conference on Computer Vision (ICCV), 2021

Di Chen

V. Koltun

Philipp Krahenbuhl

389

151

03 May 2021

Curious Exploration and Return-based Memory Restoration for Deep Reinforcement Learning

02 May 2021

Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement LearningInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Changyin Sun

Lijun Sun

127

02 May 2021

Self-supervised Augmentation Consistency for Adapting Semantic SegmentationComputer Vision and Pattern Recognition (CVPR), 2021

Nikita Araslanov

Stefan Roth

313

267

30 Apr 2021

A Physics-Constrained Deep Learning Model for Simulating Multiphase Flow in 3D Heterogeneous Porous Media

167

30 Apr 2021

On the Emergence of Whole-body Strategies from Humanoid Robot Push-recovery LearningIEEE Robotics and Automation Letters (RA-L), 2021

Diego Ferigo

Raffaello Camoriano

Paolo Maria Viceconte

Daniele Calandriello

Silvio Traversaro

Lorenzo Rosasco

Daniele Pucci

151

29 Apr 2021

Capability Iteration Network for Robot Path Planning

127

29 Apr 2021

End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning

Alessandro Paolo Capasso

Paolo Maramotti

Anthony DellÉva

A. Broggi

329

28 Apr 2021

Semi-On-Policy Training for Sample Efficient Multi-Agent Policy Gradients

152

27 Apr 2021

SocialAI 0.1: Towards a Benchmark to Stimulate Research on Socio-Cognitive Abilities in Deep Reinforcement Learning Agents

223

27 Apr 2021

Computational Performance of Deep Reinforcement Learning to find Nash EquilibriaComputational Economics (Comput. Econ.), 2021

126

26 Apr 2021

ANT: Learning Accurate Network Throughput for Better Adaptive Video Streaming

Hao Chen

Zhan Ma

26 Apr 2021

Efficient Hyperparameter Optimization for Physics-based Character AnimationProceedings of the ACM on Computer Graphics and Interactive Techniques (PACMCGIT), 2021

Zeshi Yang

Zhiqi Yin

AI4CE

184

26 Apr 2021

Formula RL: Deep Reinforcement Learning for Autonomous Racing using Telemetry Data

203

22 Apr 2021

Tackling Variabilities in Autonomous Driving

Haibin Wu

Xiaochun Ye

21 Apr 2021

Discrete-continuous Action Space Policy Gradient-based Attention for Image-Text MatchingComputer Vision and Pattern Recognition (CVPR), 2021

Shiyang Yan

Li Yu

Yuan Xie

260

21 Apr 2021

Scalable Synthesis of Verified Controllers in Deep Reinforcement Learning

Zikang Xiong

Suresh Jagannathan

194

20 Apr 2021

Outcome-Driven Reinforcement Learning via Variational InferenceNeural Information Processing Systems (NeurIPS), 2021

291

20 Apr 2021

Adaptive learning for financial markets mixing model-based and model-free RL for volatility targetingSocial Science Research Network (SSRN), 2021

Eric Benhamou

David Saltiel

219

19 Apr 2021

Deep Reinforcement Learning in a Monetary Model

19 Apr 2021

Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning

Wei Pan

121

19 Apr 2021

Planning with Expectation Models for Control

Yi Wan

143

17 Apr 2021

In Defense of the Paper

Owen Lockwood

16 Apr 2021

Towards Standardising Reinforcement Learning Approaches for Production Scheduling ProblemsProcedia CIRP (PC), 2021

Alexandru Rinciog

Anne Meyer

OffRL

111

16 Apr 2021

Reinforced Neighborhood Selection Guided Multi-Relational Graph Neural Networks

Philip S. Yu

491

137

16 Apr 2021

Curiosity-Driven Exploration via Latent Bayesian SurpriseAAAI Conference on Artificial Intelligence (AAAI), 2021

235

15 Apr 2021

Discover the Hidden Attack Path in Multi-domain Cyberspace Based on Reinforcement Learning

15 Apr 2021

TAAC: Temporally Abstract Actor-Critic for Continuous ControlNeural Information Processing Systems (NeurIPS), 2021

225

13 Apr 2021

Data-Driven Reinforcement Learning for Virtual Character Animation Control

13 Apr 2021

Learning and Planning in Complex Action SpacesInternational Conference on Machine Learning (ICML), 2021

David Silver

224

13 Apr 2021

Podracer architectures for scalable Reinforcement Learning

175

13 Apr 2021

Subgoal-based Reward Shaping to Improve Efficiency in Reinforcement LearningIEEE Access (IEEE Access), 2021

Takato Okudo

Seiji Yamada

OffRL

127

13 Apr 2021

Reward Shaping with Dynamic Trajectory AggregationIEEE International Joint Conference on Neural Network (IJCNN), 2021

Takato Okudo

Seiji Yamada

13 Apr 2021

Deep Deterministic Path Following

Georg Hess

William Ljungbergh

BDL

13 Apr 2021

Two-stage training algorithm for AI robot soccerPeerJ Computer Science (PeerJ Comput. Sci.), 2021

182

13 Apr 2021

Thief, Beware of What Get You There: Towards Understanding Model Extraction Attack

185

13 Apr 2021

Survey on reinforcement learning for language processingArtificial Intelligence Review (AIR), 2021

Víctor Uc Cetina

Nicolás Navarro-Guerrero

327

127

12 Apr 2021

Behavior-Guided Actor-Critic: Improving Exploration via Learning Policy Behavior Representation for Deep Reinforcement Learning

Ammar Fayad

M. Ibrahim

BDL

134

09 Apr 2021

Learning Sampling Policy for Faster Derivative Free Optimization

Zhou Zhai

Bin Gu

Heng-Chiao Huang

150

09 Apr 2021

Reinforced Attention for Few-Shot Learning and BeyondComputer Vision and Pattern Recognition (CVPR), 2021

Tong Zhang

Mehrtash Harandi

166

09 Apr 2021

ACERAC: Efficient reinforcement learning in fine time discretizationIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

Jakub Łyskawa

Pawel Wawrzyñski

234

08 Apr 2021

Efficient time stepping for numerical integration using reinforcement learningSIAM Journal on Scientific Computing (SISC), 2021

Eyke Hüllermeier

08 Apr 2021

Progressive extension of reinforcement learning action dimension for asymmetric assembly tasks

06 Apr 2021

Fast Design Space Exploration of Nonlinear Systems: Part IIIEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (IEEE TCAD), 2021

Prerit Terway

Kenza Hamidouche

N. Jha

108

05 Apr 2021

NQMIX: Non-monotonic Value Function Factorization for Deep Multi-Agent Reinforcement Learning

Quanlin Chen

OffRL

192

05 Apr 2021

A Dual-Critic Reinforcement Learning Framework for Frame-level Bit Allocation in HEVC/H.265Data Compression Conference (DCC), 2021

05 Apr 2021

A Dynamics Perspective of Pursuit-Evasion Games of Intelligent Agents with the Ability to LearnCybersecurity and Cyberforensics Conference (CC), 2021

03 Apr 2021