Proximal Policy Optimization Algorithms

20 July 2017

Papers citing "Proximal Policy Optimization Algorithms"

50 / 7,146 papers shown

Title
Zero-shot Deep Reinforcement Learning Driving Policy Transfer for Autonomous Vehicles based on Robust Control Zhuo Xu Chen Tang Masayoshi Tomizuka OffRL 27 35 0 07 Dec 2018
Quantifying Generalization in Reinforcement Learning K. Cobbe Oleg Klimov Christopher Hesse Taehoon Kim John Schulman OffRL 54 662 0 06 Dec 2018
Relative Entropy Regularized Policy Iteration A. Abdolmaleki Jost Tobias Springenberg Jonas Degrave Steven Bohez Yuval Tassa Dan Belov N. Heess Martin Riedmiller 27 72 0 05 Dec 2018
Adapting Auxiliary Losses Using Gradient Similarity Yunshu Du Wojciech M. Czarnecki Siddhant M. Jayakumar Mehrdad Farajtabar Razvan Pascanu Balaji Lakshminarayanan 35 156 0 05 Dec 2018
Mitigating Planner Overfitting in Model-Based Reinforcement Learning Dilip Arumugam David Abel Kavosh Asadi N. Gopalan Christopher Grimm Jun Ki Lee Lucas Lehnert Michael L. Littman 24 11 0 03 Dec 2018
Generative Adversarial Self-Imitation Learning Yijie Guo Junhyuk Oh Satinder Singh Honglak Lee GAN 29 58 0 03 Dec 2018
Hierarchical Policy Design for Sample-Efficient Learning of Robot Table Tennis Through Self-Play R. Mahjourian Navdeep Jaitly N. Lazić Sergey Levine Risto Miikkulainen 24 16 0 30 Nov 2018
Hardware Conditioned Policies for Multi-Robot Transfer Learning Tao Chen Adithyavairavan Murali Abhinav Gupta 29 102 0 24 Nov 2018
Connecting the Dots Between MLE and RL for Sequence Prediction Bowen Tan Zhiting Hu Zichao Yang Ruslan Salakhutdinov Eric Xing 28 24 0 24 Nov 2018
Hierarchical visuomotor control of humanoids J. Merel Arun Ahuja Vu Pham S. Tunyasuvunakool Siqi Liu Dhruva Tirumala N. Heess Greg Wayne 48 97 0 23 Nov 2018
Guiding Policies with Language via Meta-Learning John D. Co-Reyes Abhishek Gupta Suvansh Sanjeev Nick Altieri Jacob Andreas John DeNero Pieter Abbeel Sergey Levine LM&Ro 26 63 0 19 Nov 2018
Scalable agent alignment via reward modeling: a research direction Jan Leike David M. Krueger Tom Everitt Miljan Martic Vishal Maini Shane Legg 39 397 0 19 Nov 2018
Policy Optimization with Model-based Explorations Feiyang Pan Qingpeng Cai Anxiang Zeng C. Pan Qing Da Hua-Lin He Qing He Pingzhong Tang 36 11 0 18 Nov 2018
Towards Governing Agent's Efficacy: Action-Conditional $β$ -VAE for Deep Transparent Reinforcement Learning John Yang Gyujeong Lee Minsung Hyun Simyung Chang Nojun Kwak 29 3 0 11 Nov 2018
Sample-Efficient Policy Learning based on Completely Behavior Cloning Qiming Zou Ling Wang K. Lu Yu Li OffRL 25 0 0 09 Nov 2018
Meta-Learning for Multi-objective Reinforcement Learning Xi Chen Ali Ghadirzadeh Mårten Björkman Pablo G. Cámara OffRL 23 54 0 08 Nov 2018
Correlation Filter Selection for Visual Tracking Using Reinforcement Learning Yanchun Xie Jimin Xiao Hassan Jameel Asghar Jeyarajan Thiyagalingam Dali Kaafar 23 21 0 08 Nov 2018
RoboTurk: A Crowdsourcing Platform for Robotic Skill Learning through Imitation Mehdi Letafati Yuke Zhu Animesh Garg Jonathan Booher Max Spero ... John Emmons Anchit Gupta Emre Orbay Silvio Savarese Li Fei-Fei OffRL 48 286 0 07 Nov 2018
A Closer Look at Deep Policy Gradients Andrew Ilyas Logan Engstrom Shibani Santurkar Dimitris Tsipras Firdaus Janoos Larry Rudolph Aleksander Madry 30 50 0 06 Nov 2018
Contingency-Aware Exploration in Reinforcement Learning Jongwook Choi Yijie Guo Marcin Moczulski Junhyuk Oh Neal Wu Mohammad Norouzi Honglak Lee 27 73 0 05 Nov 2018
VIREL: A Variational Inference Framework for Reinforcement Learning M. Fellows Anuj Mahajan Tim G. J. Rudner Shimon Whiteson DRL 38 54 0 03 Nov 2018
Temporal Regularization in Markov Decision Process Pierre Thodoroff A. Durand Joelle Pineau Doina Precup 30 15 0 01 Nov 2018
Assessing Generalization in Deep Reinforcement Learning Charles Packer Katelyn Gao Jernej Kos Philipp Krahenbuhl V. Koltun D. Song OffRL 18 234 0 29 Oct 2018
One-Shot Hierarchical Imitation Learning of Compound Visuomotor Tasks Tianhe Yu Pieter Abbeel Sergey Levine Chelsea Finn 18 68 0 25 Oct 2018
RLgraph: Modular Computation Graphs for Deep Reinforcement Learning Michael Schaarschmidt Sven Mika Kai Fricke Eiko Yoneki OffRL 23 5 0 21 Oct 2018
Actor-Critic Policy Optimization in Partially Observable Multiagent Environments S. Srinivasan Marc Lanctot V. Zambaldi Julien Perolat K. Tuyls Rémi Munos Michael Bowling 13 148 0 21 Oct 2018
BabyAI: A Platform to Study the Sample Efficiency of Grounded Language Learning Maxime Chevalier-Boisvert Dzmitry Bahdanau Salem Lahlou Lucas Willems Chitwan Saharia Thien Huu Nguyen Yoshua Bengio ELM 45 233 0 18 Oct 2018
Policy Gradient in Partially Observable Environments: Approximation and Convergence Kamyar Azizzadenesheli Manish Kumar Bera Anima Anandkumar OffRL 30 8 0 18 Oct 2018
Learning Socially Appropriate Robot Approaching Behavior Toward Groups using Deep Reinforcement Learning Yuan Gao Fangkai Yang Martin Frisk Daniel Hernández Christopher E. Peters Ginevra Castellano 27 5 0 16 Oct 2018
ProMP: Proximal Meta-Policy Search Jonas Rothfuss Dennis Lee I. Clavera Tamim Asfour Pieter Abbeel 35 209 0 16 Oct 2018
GPU-Accelerated Robotic Simulation for Distributed Reinforcement Learning Jacky Liang Viktor Makoviychuk Ankur Handa N. Chentanez Miles Macklin Dieter Fox AI4CE 27 182 0 12 Oct 2018
Policy Transfer with Strategy Optimization Wenhao Yu Chenxi Liu Greg Turk 38 80 0 12 Oct 2018
Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience Yevgen Chebotar Ankur Handa Viktor Makoviychuk Miles Macklin J. Issac Nathan D. Ratliff Dieter Fox 10 500 0 12 Oct 2018
A Survey and Critique of Multiagent Deep Reinforcement Learning Pablo Hernandez-Leal Bilal Kartal Matthew E. Taylor OffRL 48 555 0 12 Oct 2018
Parametrized Deep Q-Networks Learning: Reinforcement Learning with Discrete-Continuous Hybrid Action Space Jiechao Xiong Qing Wang Zhuoran Yang Peng Sun Lei Han Yang Zheng Haobo Fu Tong Zhang Ji Liu Han Liu 37 170 0 10 Oct 2018
Reinforcement Learning for Improving Agent Design David R Ha 56 124 0 09 Oct 2018
Actor-Attention-Critic for Multi-Agent Reinforcement Learning Shariq Iqbal Fei Sha 11 739 0 05 Oct 2018
PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation Perttu Hämäläinen Amin Babadi Xiaoxiao Ma J. Lehtinen 32 62 0 05 Oct 2018
AutoLoss: Learning Discrete Schedules for Alternate Optimization Haowen Xu Huatian Zhang Zhiting Hu Xiaodan Liang Ruslan Salakhutdinov Eric Xing 32 30 0 04 Oct 2018
Episodic Curiosity through Reachability Nikolay Savinov Anton Raichuk Raphaël Marinier Damien Vincent Marc Pollefeys Timothy Lillicrap Sylvain Gelly 17 267 0 04 Oct 2018
Learning Particle Dynamics for Manipulating Rigid Bodies, Deformable Objects, and Fluids Yunzhu Li Jiajun Wu Russ Tedrake J. Tenenbaum Antonio Torralba PINN AI4CE 37 390 0 03 Oct 2018
CEM-RL: Combining evolutionary and gradient-based methods for policy search Aloïs Pourchot Olivier Sigaud 32 160 0 02 Oct 2018
The Dreaming Variational Autoencoder for Reinforcement Learning Environments Per-Arne Andersen M. G. Olsen Ole-Christoffer Granmo DRL 22 17 0 02 Oct 2018
ChainQueen: A Real-Time Differentiable Physical Simulator for Soft Robotics Yuanming Hu Jiancheng Liu Andrew Spielberg J. Tenenbaum William T. Freeman Jiajun Wu Daniela Rus Wojciech Matusik AI4CE 30 262 0 02 Oct 2018
Directed-Info GAIL: Learning Hierarchical Policies from Unsegmented Demonstrations using Directed Information Arjun Sharma Mohit Sharma Nicholas Rhinehart Kris Kitani 27 68 0 29 Sep 2018
Boosting Trust Region Policy Optimization by Normalizing Flows Policy Yunhao Tang Shipra Agrawal TPM 39 29 0 27 Sep 2018
Scaling simulation-to-real transfer by learning composable robot skills Ryan Julian Eric Heiden Zhanpeng He Hejia Zhang S. Schaal Joseph J. Lim Gaurav Sukhatme Karol Hausman 25 15 0 26 Sep 2018
Fast Motion Planning for High-DOF Robot Systems Using Hierarchical System Identification Biao Jia Zherong Pan Tianyi Zhou 29 5 0 21 Sep 2018
Adversarial Imitation via Variational Inverse Reinforcement Learning A. H. Qureshi Byron Boots Michael C. Yip 22 61 0 17 Sep 2018
Model-Based Reinforcement Learning via Meta-Policy Optimization I. Clavera Jonas Rothfuss John Schulman Yasuhiro Fujita Tamim Asfour Pieter Abbeel 30 225 0 14 Sep 2018