OpenAI Gym

5 June 2016

Papers citing "OpenAI Gym"

50 / 1,677 papers shown

Title
VIREL: A Variational Inference Framework for Reinforcement Learning M. Fellows Anuj Mahajan Tim G. J. Rudner Shimon Whiteson DRL 38 54 0 03 Nov 2018
Towards a Simple Approach to Multi-step Model-based Reinforcement Learning Kavosh Asadi Evan Cater Dipendra Kumar Misra Michael L. Littman OffRL 31 13 0 31 Oct 2018
Assessing Generalization in Deep Reinforcement Learning Charles Packer Katelyn Gao Jernej Kos Philipp Krahenbuhl V. Koltun D. Song OffRL 18 233 0 29 Oct 2018
Sample-Efficient Learning of Nonprehensile Manipulation Policies via Physics-Based Informed State Distributions Lerrel Pinto Aditya Mandalika Brian Hou S. Srinivasa 33 13 0 24 Oct 2018
RLgraph: Modular Computation Graphs for Deep Reinforcement Learning Michael Schaarschmidt Sven Mika Kai Fricke Eiko Yoneki OffRL 23 5 0 21 Oct 2018
Autonomous Self-Explanation of Behavior for Interactive Reinforcement Learning Agents Yosuke Fukuchi Masahiko Osawa Hiroshi Yamakawa M. Imai 27 31 0 20 Oct 2018
O2A: One-shot Observational learning with Action vectors Leo Pauly Wisdom C. Agboh David C. Hogg R. Fuentes 57 9 0 17 Oct 2018
Multiple Interactions Made Easy (MIME): Large Scale Demonstrations Data for Imitation Pratyusha Sharma Lekha Mohan Lerrel Pinto Abhinav Gupta 23 120 0 16 Oct 2018
Batch Active Preference-Based Learning of Reward Functions Erdem Biyik Dorsa Sadigh 22 108 0 10 Oct 2018
Reinforcement Learning for Improving Agent Design David R Ha 40 124 0 09 Oct 2018
PPO-CMA: Proximal Policy Optimization with Covariance Matrix Adaptation Perttu Hämäläinen Amin Babadi Xiaoxiao Ma J. Lehtinen 32 62 0 05 Oct 2018
Energy-Based Hindsight Experience Prioritization Rui Zhao Volker Tresp 19 74 0 02 Oct 2018
Directed-Info GAIL: Learning Hierarchical Policies from Unsegmented Demonstrations using Directed Information Arjun Sharma Mohit Sharma Nicholas Rhinehart Kris Kitani 27 68 0 29 Sep 2018
Boosting Trust Region Policy Optimization by Normalizing Flows Policy Yunhao Tang Shipra Agrawal TPM 39 29 0 27 Sep 2018
Omega-Regular Objectives in Model-Free Reinforcement Learning E. M. Hahn Mateo Perez S. Schewe Fabio Somenzi Ashutosh Trivedi D. Wojtczak 21 145 0 26 Sep 2018
Switching Isotropic and Directional Exploration with Parameter Space Noise in Deep Reinforcement Learning Izumi Karino Kazutoshi Tanaka Ryuma Niiyama Yasuo Kuniyoshi 19 3 0 18 Sep 2018
Deep Learning with Experience Ranking Convolutional Neural Network for Robot Manipulator Hai V. Nguyen Hung M. La M. Deans SSL OffRL 12 8 0 16 Sep 2018
Deterministic Implementations for Reproducibility in Deep Reinforcement Learning P. Nagarajan Garrett A. Warnell Peter Stone 27 51 0 15 Sep 2018
Model-Based Reinforcement Learning via Meta-Policy Optimization I. Clavera Jonas Rothfuss John Schulman Yasuhiro Fujita Tamim Asfour Pieter Abbeel 30 225 0 14 Sep 2018
Sim-to-Real Transfer Learning using Robustified Controllers in Robotic Tasks involving Complex Dynamics J. Baar Alan Sullivan Radu Cordorel Devesh K. Jha Diego Romeres D. Nikovski 36 57 0 13 Sep 2018
VPE: Variational Policy Embedding for Transfer Reinforcement Learning Isac Arnekvist Danica Kragic J. A. Stork OffRL 25 37 0 10 Sep 2018
Unity: A General Platform for Intelligent Agents Arthur Juliani Vincent-Pierre Berges Esh Vckay Andrew Cohen Jonathan Harper ... Chris Goy Yuan Gao Hunter Henry Marwan Mattar Danny Lange 39 808 0 07 Sep 2018
Recurrent World Models Facilitate Policy Evolution David R Ha Jürgen Schmidhuber SyDa TPM 52 921 0 04 Sep 2018
Texar: A Modularized, Versatile, and Extensible Toolkit for Text Generation Zhiting Hu Haoran Shi Bowen Tan Wentao Wang Zichao Yang ... Zhengzhong Liu Xiaodan Liang Wangrong Zhu Devendra Singh Sachan Eric Xing VLM 25 56 0 04 Sep 2018
Gibson Env: Real-World Perception for Embodied Agents F. Xia Amir Zamir Zhi-Yang He Alexander Sax Jitendra Malik Silvio Savarese AI4CE LM&Ro 34 817 0 31 Aug 2018
SOLAR: Deep Structured Representations for Model-Based Reinforcement Learning Marvin Zhang Sharad Vikram Laura M. Smith Pieter Abbeel Matthew J. Johnson Sergey Levine OffRL 23 41 0 28 Aug 2018
SOTER: A Runtime Assurance Framework for Programming Safe Robotics Systems Ankush Desai Shromona Ghosh S. Seshia N. Shankar A. Tiwari 17 12 0 23 Aug 2018
GeneSys: Enabling Continuous Learning through Neural Network Evolution in Hardware A. Samajdar Parth Mannan K. Garg T. Krishna 32 20 0 03 Aug 2018
Learning Actionable Representations from Visual Observations Debidatta Dwibedi Jonathan Tompson Corey Lynch P. Sermanet SSL 22 80 0 02 Aug 2018
Learning Dexterous In-Hand Manipulation OpenAI OpenAI Marcin Andrychowicz Bowen Baker Maciek Chociej Rafal Jozefowicz ... Szymon Sidor Joshua Tobin Peter Welinder Lilian Weng Wojciech Zaremba 47 1,858 0 01 Aug 2018
ToriLLE: Learning Environment for Hand-to-Hand Combat Anssi Kanervisto Ville Hautamaki 26 2 0 26 Jul 2018
Meta-Learning Priors for Efficient Online Bayesian Regression James Harrison Apoorva Sharma Marco Pavone BDL 29 99 0 24 Jul 2018
FuzzerGym: A Competitive Framework for Fuzzing and Learning W. Drozd Michael D. Wagner 33 32 0 19 Jul 2018
Online Robust Policy Learning in the Presence of Unknown Adversaries Aaron J. Havens Zhanhong Jiang Soumik Sarkar AAML 24 43 0 16 Jul 2018
Toward Interpretable Deep Reinforcement Learning with Linear Model U-Trees Guiliang Liu Oliver Schulte Wang Zhu Qingcan Li AI4CE 17 135 0 16 Jul 2018
Variance Reduction for Reinforcement Learning in Input-Driven Environments Hongzi Mao S. Venkatakrishnan Malte Schwarzkopf Mohammad Alizadeh OffRL 41 95 0 06 Jul 2018
A Dissection of Overfitting and Generalization in Continuous Reinforcement Learning Amy Zhang Nicolas Ballas Joelle Pineau CLL OffRL 33 177 0 20 Jun 2018
RUDDER: Return Decomposition for Delayed Rewards Jose A. Arjona-Medina Michael Gillhofer Michael Widrich Thomas Unterthiner Johannes Brandstetter Sepp Hochreiter 35 214 0 20 Jun 2018
Sim-to-Real Reinforcement Learning for Deformable Object Manipulation J. Matas Stephen James Andrew J. Davison AI4CE 29 357 0 20 Jun 2018
VirtualHome: Simulating Household Activities via Programs Xavier Puig K. Ra Marko Boben Jiaman Li Tingwu Wang Sanja Fidler Antonio Torralba LM&Ro 30 478 0 19 Jun 2018
Laplacian Smoothing Gradient Descent Stanley Osher Bao Wang Penghang Yin Xiyang Luo Farzin Barekat Minh Pham A. Lin ODL 22 43 0 17 Jun 2018
Qualitative Measurements of Policy Discrepancy for Return-Based Deep Q-Network Wenjia Meng Qian Zheng L. Yang Pengfei Li Gang Pan 20 21 0 14 Jun 2018
Accelerating Imitation Learning with Predictive Models Ching-An Cheng Xinyan Yan Evangelos A. Theodorou Byron Boots 32 21 0 12 Jun 2018
Re-evaluating Evaluation David Balduzzi K. Tuyls Julien Perolat T. Graepel MoMe 30 97 0 07 Jun 2018
Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation Jiaxuan You Bowen Liu Rex Ying Vijay S. Pande J. Leskovec GNN 215 888 0 07 Jun 2018
Human-like generalization in a machine through predicate learning L. Doumas Guillermo Puebla Andrea E. Martin NAI 33 9 0 05 Jun 2018
BindsNET: A machine learning-oriented spiking neural networks library in Python Hananel Hazan D. J. Saunders Hassaan Khan Darpan T. Sanghavi H. Siegelmann R. Kozma AI4CE 41 229 0 04 Jun 2018
Challenges in High-dimensional Reinforcement Learning with Evolution Strategies Nils Müller Tobias Glasmachers 33 28 0 04 Jun 2018
Sequential Attacks on Agents for Long-Term Adversarial Goals E. Tretschk Seong Joon Oh Mario Fritz OnRL 329 47 1 31 May 2018
Supervised Policy Update for Deep Reinforcement Learning Q. Vuong Yiming Zhang Keith Ross 19 20 0 29 May 2018