v1v2 (latest)

Clipped Action Policy Gradient

21 February 2018

Yasuhiro Fujita

S. Maeda

OffRL

ArXiv (abs)PDF HTML Github (31★)

Papers citing "Clipped Action Policy Gradient"

24 / 24 papers shown

Guided Reinforcement Learning for Omnidirectional 3D Jumping in Quadruped Robots

437

22 Jul 2025

Off-OAB: Off-Policy Policy Gradient Method with Optimal Action-Dependent BaselineIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2024

Qian Zheng

Gang Pan

250

04 May 2024

KnowGPT: Knowledge Graph based Prompting for Large Language Models

Daochen Zha

489

11 Dec 2023

Handling Cost and Constraints with Off-Policy Deep Reinforcement Learning

237

30 Nov 2023

Clipped-Objective Policy Gradients for Pessimistic Policy Optimization

Jared Markowitz

Edward W. Staley

OffRL

281

10 Nov 2023

Policy Gradient Algorithms Implicitly Optimize by Continuation

Adrien Bolland

Gilles Louppe

D. Ernst

325

11 May 2023

Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action ConstraintsIEEE Robotics and Automation Letters (RA-L), 2023

198

18 Apr 2023

Distillation Policy Optimization

Jianfei Ma

OffRL

618

01 Feb 2023

A Risk-Sensitive Approach to Policy OptimizationAAAI Conference on Artificial Intelligence (AAAI), 2022

311

19 Aug 2022

Remember and Forget Experience Replay for Multi-Agent Reinforcement Learning

253

24 Mar 2022

Provably Efficient Convergence of Primal-Dual Actor-Critic with Nonlinear Function ApproximationAdaptive Agents and Multi-Agent Systems (AAMAS), 2022

Jing Dong

Li Shen

Ying Xu

Baoxiang Wang

253

28 Feb 2022

Pseudo-Labeled Auto-Curriculum Learning for Semi-Supervised Keypoint LocalizationInternational Conference on Learning Representations (ICLR), 2022

Wentao Liu

Ping Luo

Wanli Ouyang

241

21 Jan 2022

Explaining Off-Policy Actor-Critic From A Bias-Variance Perspective

Ting-Han Fan

Peter J. Ramadge

CML FAtt OffRL

254

06 Oct 2021

Escaping from Zero Gradient: Revisiting Action-Constrained Reinforcement Learning via Frank-Wolfe Policy OptimizationConference on Uncertainty in Artificial Intelligence (UAI), 2021

306

22 Feb 2021

Factored Policy Gradients: Leveraging Structure for Efficient Learning in MOMDPsNeural Information Processing Systems (NeurIPS), 2021

Thomas Spooner

N. Vadori

Sumitra Ganesh

235

20 Feb 2021

Measuring Progress in Deep Reinforcement Learning Sample Efficiency

Florian E. Dorner

185

09 Feb 2021

A Contraction Approach to Model-based Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2020

Ting-Han Fan

Peter J. Ramadge

OffRL

174

18 Sep 2020

SuperSuit: Simple Microwrappers for Reinforcement Learning Environments

J. K. Terry

Benjamin Black

Ananth Hari

153

17 Aug 2020

Action sequencing using visual permutations

261

03 Aug 2020

A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme

Paavo Parmas

Masashi Sugiyama

166

14 Oct 2019

Striving for Simplicity and Performance in Off-Policy DRL: Output Normalization and Non-Uniform Sampling

278

05 Oct 2019

Generalization in Transfer LearningRobotica (Cambridge. Print) (RCP), 2019

S. E. Ada

Emre Ugur

H. L. Akin

205

03 Sep 2019

Augment-Reinforce-Merge Policy Gradient for Binary Stochastic Policy

Yunhao Tang

Mingzhang Yin

Mingyuan Zhou

123

13 Mar 2019

Understanding the impact of entropy on policy optimization

Zafarali Ahmed

Nicolas Le Roux

Mohammad Norouzi

Dale Schuurmans

410

302

27 Nov 2018