Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 7,402 papers shown

Title
Universal Planning Networks A. Srinivas Allan Jabri Pieter Abbeel Sergey Levine Chelsea Finn SSL 37 145 0 02 Apr 2018
Learning to Run challenge solutions: Adapting reinforcement learning methods for neuromusculoskeletal environments L. Kidzinski Sharada Mohanty Carmichael F. Ong Zhewei Huang Shuchang Zhou ... Sean F. Carroll Jennifer Hicks Sergey Levine M. Salathé Scott L. Delp 45 87 0 02 Apr 2018
Learning to Run challenge: Synthesizing physiologically accurate motion using deep reinforcement learning L. Kidzinski Sharada Mohanty Carmichael F. Ong Jennifer Hicks Sean F. Carroll Sergey Levine M. Salathé Scott L. Delp 42 60 0 31 Mar 2018
Reinforcement learning for non-prehensile manipulation: Transfer from simulation to physical system Kendall Lowrey S. Kolev Jeremy Dao Aravind Rajeswaran E. Todorov 26 58 0 28 Mar 2018
Long short-term memory and learning-to-learn in networks of spiking neurons G. Bellec Darjan Salaj Anand Subramoney Robert Legenstein Wolfgang Maass 130 484 0 26 Mar 2018
Automated Curriculum Learning by Rewarding Temporally Rare Events Niels Justesen S. Risi OffRL 40 20 0 19 Mar 2018
Feedback Control For Cassie With Deep Reinforcement Learning Zhaoming Xie Glen Berseth Patrick Clary J. Hurst M. van de Panne 27 174 0 15 Mar 2018
Policy Search in Continuous Action Domains: an Overview Olivier Sigaud F. Stulp 21 72 0 13 Mar 2018
Deep Learning in Mobile and Wireless Networking: A Survey Chaoyun Zhang P. Patras Hamed Haddadi 73 1,308 0 12 Mar 2018
Accelerated Methods for Deep Reinforcement Learning Adam Stooke Pieter Abbeel OffRL OnRL 25 133 0 07 Mar 2018
Transfer Learning with Neural AutoML Catherine Wong N. Houlsby Yifeng Lu Andrea Gesmundo 19 114 0 07 Mar 2018
Some Considerations on Learning to Explore via Meta-Reinforcement Learning Bradly C. Stadie Ge Yang Rein Houthooft Xi Chen Yan Duan Yuhuai Wu Pieter Abbeel Ilya Sutskever LRM 40 116 0 03 Mar 2018
Deep Reinforcement Learning for Join Order Enumeration Ryan Marcus Olga Papaemmanouil 32 232 0 28 Feb 2018
Computational Theories of Curiosity-Driven Learning Pierre-Yves Oudeyer 40 64 0 28 Feb 2018
The Mirage of Action-Dependent Baselines in Reinforcement Learning George Tucker Surya Bhupatiraju S. Gu Richard Turner Zoubin Ghahramani Sergey Levine OffRL 30 127 0 27 Feb 2018
Reinforcement and Imitation Learning for Diverse Visuomotor Skills Yuke Zhu Ziyun Wang J. Merel Andrei A. Rusu Tom Erez ... S. Tunyasuvunakool János Kramár R. Hadsell Nando de Freitas N. Heess SSL 45 317 0 26 Feb 2018
Multi-Goal Reinforcement Learning: Challenging Robotics Environments and Request for Research Matthias Plappert Marcin Andrychowicz Alex Ray Bob McGrew Bowen Baker ... Joshua Tobin Maciek Chociej Peter Welinder Vikash Kumar Wojciech Zaremba 33 560 0 26 Feb 2018
Verifying Controllers Against Adversarial Examples with Bayesian Optimization Shromona Ghosh Felix Berkenkamp G. Ranade S. Qadeer Ashish Kapoor AAML 33 45 0 23 Feb 2018
Structured Control Nets for Deep Reinforcement Learning Mario Srouji Jian Zhang Ruslan Salakhutdinov 38 43 0 22 Feb 2018
Clipped Action Policy Gradient Yasuhiro Fujita S. Maeda OffRL 34 37 0 21 Feb 2018
Fourier Policy Gradients M. Fellows K. Ciosek Shimon Whiteson 35 15 0 19 Feb 2018
GEP-PG: Decoupling Exploration and Exploitation in Deep Reinforcement Learning Algorithms Cédric Colas Olivier Sigaud Pierre-Yves Oudeyer 29 158 0 14 Feb 2018
Evolved Policy Gradients Rein Houthooft Richard Y. Chen Phillip Isola Bradly C. Stadie Filip Wolski Jonathan Ho Pieter Abbeel 54 227 0 13 Feb 2018
Diversity-Driven Exploration Strategy for Deep Reinforcement Learning Zhang-Wei Hong Tzu-Yun Shann Shih-Yang Su Yi-Hsiang Chang Chun-Yi Lee 18 122 0 13 Feb 2018
Hierarchical Learning for Modular Robots R. Kojcev Nora Etxezarreta Alejandro Hernández Víctor Mayoral 32 4 0 12 Feb 2018
Towards self-adaptable robots: from programming to training machines Víctor Mayoral R. Kojcev Nora Etxezarreta Alejandro Hernández I. Zamalloa 16 5 0 12 Feb 2018
Evaluation of Deep Reinforcement Learning Methods for Modular Robots R. Kojcev Nora Etxezarreta Alejandro Hernández Víctor Mayoral OffRL 28 4 0 07 Feb 2018
VR-Goggles for Robots: Real-to-sim Domain Adaptation for Visual Control Jingwei Zhang L. Tai Peng Yun Yufeng Xiong Ming-Yuan Liu Joschka Boedecker Wolfram Burgard 21 122 0 01 Feb 2018
An Empirical Analysis of Proximal Policy Optimization with Kronecker-factored Natural Gradients Jiaming Song Yuhuai Wu 35 2 0 17 Jan 2018
Expected Policy Gradients for Reinforcement Learning K. Ciosek Shimon Whiteson 50 51 0 10 Jan 2018
Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes Igor Adamski R. Adamski T. Grel Adam Jedrych Kamil Kaczmarek Henryk Michalewski OffRL 41 37 0 09 Jan 2018
Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations Xingyu Wang Diego Klabjan 32 39 0 07 Jan 2018
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor Tuomas Haarnoja Aurick Zhou Pieter Abbeel Sergey Levine 106 8,201 0 04 Jan 2018
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation Bo Dai Albert Eaton Shaw Lihong Li Lin Xiao Niao He Zhen Liu Jianshu Chen Le Song 39 25 0 29 Dec 2017
Boosting the Actor with Dual Critic Bo Dai Albert Eaton Shaw Niao He Lihong Li Le Song 41 46 0 29 Dec 2017
Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning F. Such Vashisht Madhavan Edoardo Conti Joel Lehman Kenneth O. Stanley Jeff Clune 47 687 0 18 Dec 2017
Time Limits in Reinforcement Learning Fabio Pardo Arash Tavakoli Vitaly Levdik Petar Kormushev CLL 44 158 0 01 Dec 2017
Comparing Deep Reinforcement Learning and Evolutionary Methods in Continuous Control Shangtong Zhang Osmar R. Zaiane 45 10 0 30 Nov 2017
Cascade Attribute Learning Network Zhuo Xu Haonan Chang Masayoshi Tomizuka 33 4 0 24 Nov 2017
Action Branching Architectures for Deep Reinforcement Learning Arash Tavakoli Fabio Pardo Petar Kormushev 25 260 0 24 Nov 2017
Can Deep Reinforcement Learning Solve Erdos-Selfridge-Spencer Games? M. Raghu A. Irpan Jacob Andreas Robert D. Kleinberg Quoc V. Le Jon M. Kleinberg 16 28 0 07 Nov 2017
Diff-DAC: Distributed Actor-Critic for Average Multitask Deep Reinforcement Learning Sergio Valcarcel Macua Aleksi Tukiainen D. Hernández David Baldazo Enrique Munoz de Cote S. Zazo 39 29 0 28 Oct 2017
Deep Imitation Learning for Complex Manipulation Tasks from Virtual Reality Teleoperation Tianhao Zhang Zoe McCarthy Owen Jow Dennis Lee Xi Chen Ken Goldberg Pieter Abbeel SSL 41 649 0 12 Oct 2017
Neural Optimizer Search with Reinforcement Learning Irwan Bello Barret Zoph Vijay Vasudevan Quoc V. Le ODL 29 384 0 21 Sep 2017
TensorFlow Agents: Efficient Batched Reinforcement Learning in TensorFlow Danijar Hafner James Davidson Vincent Vanhoucke OffRL 19 49 0 08 Sep 2017
Deep Learning for Video Game Playing Niels Justesen Philip Bontrager Julian Togelius S. Risi VLM 29 207 0 25 Aug 2017
A Brief Survey of Deep Reinforcement Learning Kai Arulkumaran M. Deisenroth Miles Brundage Anil Anthony Bharath OffRL 65 2,787 0 19 Aug 2017
Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation Yuhuai Wu Elman Mansimov Shun Liao Roger C. Grosse Jimmy Ba OffRL 22 624 0 17 Aug 2017
A Machine Learning Approach to Routing Asaf Valadarsky Michael Schapira Dafna Shahaf Aviv Tamar 28 38 0 10 Aug 2017
An Information-Theoretic Optimality Principle for Deep Reinforcement Learning Felix Leibfried Jordi Grau-Moya Haitham Bou-Ammar 51 24 0 06 Aug 2017