Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
1707.06347
Cited By

Proximal Policy Optimization Algorithms

v1v2 (latest)

Proximal Policy Optimization Algorithms

20 July 2017

Prafulla Dhariwal

ArXiv (abs)PDF HTML

Papers citing "Proximal Policy Optimization Algorithms"

18 / 11,418 papers shown

Multi-task Learning with Gradient Guided Policy Specialization

Multi-task Learning with Gradient Guided Policy Specialization

Wenhao Yu

98

3

0

23 Sep 2017

Expanding Motor Skills through Relay Neural Networks

Expanding Motor Skills through Relay Neural Networks

Visak C. V. Kumar

52

2

0

22 Sep 2017

Neural Optimizer Search with Reinforcement Learning

Neural Optimizer Search with Reinforcement Learning

Vijay Vasudevan

255

400

0

21 Sep 2017

Local Communication Protocols for Learning Complex Swarm Behaviors with
Deep Reinforcement Learning

Local Communication Protocols for Learning Complex Swarm Behaviors with Deep Reinforcement Learning

Maximilian Hüttenrauch

Adrian Šošić

Gerhard Neumann

84

3

0

21 Sep 2017

OptionGAN: Learning Joint Reward-Policy Options using Generative
Adversarial Inverse Reinforcement Learning

OptionGAN: Learning Joint Reward-Policy Options using Generative Adversarial Inverse Reinforcement Learning

Peter Henderson

Pierre-Luc Bacon

152

76

0

20 Sep 2017

Deep Reinforcement Learning that Matters

Deep Reinforcement Learning that Matters

Peter Henderson

473

2,139

0

19 Sep 2017

Learning Sampling Distributions for Robot Motion Planning

Learning Sampling Distributions for Robot Motion Planning

273

388

0

16 Sep 2017

TensorFlow Agents: Efficient Batched Reinforcement Learning in
TensorFlow

TensorFlow Agents: Efficient Batched Reinforcement Learning in TensorFlow

Vincent Vanhoucke

185

52

0

08 Sep 2017

Mirror Descent Search and its Acceleration

Mirror Descent Search and its Acceleration

Megumi Miyashita

121

7

0

08 Sep 2017

Deep Learning for Video Game Playing

Deep Learning for Video Game Playing

Philip Bontrager

Julian Togelius

259

227

0

25 Aug 2017

A Brief Survey of Deep Reinforcement Learning

A Brief Survey of Deep Reinforcement Learning

Kai Arulkumaran

Anil Anthony Bharath

389

2,830

0

19 Aug 2017

Scalable trust-region method for deep reinforcement learning using
Kronecker-factored approximation

Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation

Roger C. Grosse

Jimmy Ba

349

659

0

17 Aug 2017

A Machine Learning Approach to Routing

A Machine Learning Approach to Routing

Asaf Valadarsky

Michael Schapira

153

39

0

10 Aug 2017

An Information-Theoretic Optimality Principle for Deep Reinforcement
Learning

An Information-Theoretic Optimality Principle for Deep Reinforcement Learning

Felix Leibfried

Jordi Grau-Moya

Haitham Bou-Ammar

351

24

0

06 Aug 2017

Learning Transferable Architectures for Scalable Image Recognition

Learning Transferable Architectures for Scalable Image Recognition

Vijay Vasudevan

Jonathon Shlens

738

6,001

0

21 Jul 2017

Trust-PCL: An Off-Policy Trust Region Method for Continuous Control

Trust-PCL: An Off-Policy Trust Region Method for Continuous Control

Mohammad Norouzi

Dale Schuurmans

208

113

0

06 Jul 2017

Teacher-Student Curriculum Learning

Teacher-Student Curriculum Learning

Tambet Matiisen

460

425

0

01 Jul 2017

Trust Region Policy Optimization

Trust Region Policy Optimization

Pieter Abbeel

954

7,476

0

19 Feb 2015

1 2 3...227 228 229