D4RL: Datasets for Deep Data-Driven Reinforcement Learning

15 April 2020

Papers citing "D4RL: Datasets for Deep Data-Driven Reinforcement Learning"

50 / 927 papers shown

Title
Hierarchical Few-Shot Imitation with Skill Transition Models Kourosh Hakhamaneshi Ruihan Zhao Albert Zhan Pieter Abbeel Michael Laskin OffRL 11 40 0 19 Jul 2021
Conservative Objective Models for Effective Offline Model-Based Optimization Brandon Trabucco Aviral Kumar Xinyang Geng Sergey Levine OffRL 42 86 0 14 Jul 2021
Conservative Offline Distributional Reinforcement Learning Yecheng Jason Ma Dinesh Jayaraman Osbert Bastani OffRL 70 78 0 12 Jul 2021
Offline Meta-Reinforcement Learning with Online Self-Supervision Vitchyr H. Pong Ashvin Nair Laura M. Smith Catherine Huang Sergey Levine OffRL 32 66 0 08 Jul 2021
Supervised Off-Policy Ranking Yue Jin Yue Zhang Tao Qin Xudong Zhang Jian Yuan Houqiang Li Tie-Yan Liu OffRL 32 5 0 03 Jul 2021
Offline-to-Online Reinforcement Learning via Balanced Replay and Pessimistic Q-Ensemble Seunghyun Lee Younggyo Seo Kimin Lee Pieter Abbeel Jinwoo Shin OffRL OnRL 14 179 0 01 Jul 2021
Brax -- A Differentiable Physics Engine for Large Scale Rigid Body Simulation C. Freeman Erik Frey Anton Raichuk Sertan Girgin Igor Mordatch Olivier Bachem 39 349 0 24 Jun 2021
OptiDICE: Offline Policy Optimization via Stationary Distribution Correction Estimation Jongmin Lee Wonseok Jeon Byung-Jun Lee J. Pineau Kee-Eung Kim OffRL 31 90 0 21 Jun 2021
Boosting Offline Reinforcement Learning with Residual Generative Modeling Hua Wei Deheng Ye Zhao Liu Hao Wu Bo Yuan Qiang Fu Wei Yang Z. Li OffRL 26 9 0 19 Jun 2021
The Curse of Passive Data Collection in Batch Reinforcement Learning Chenjun Xiao Ilbin Lee Bo Dai Dale Schuurmans Csaba Szepesvári OffRL 17 1 0 18 Jun 2021
Behavioral Priors and Dynamics Models: Improving Performance and Domain Transfer in Offline RL Catherine Cang Aravind Rajeswaran Pieter Abbeel Michael Laskin OffRL 19 29 0 16 Jun 2021
Offline RL Without Off-Policy Evaluation David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna OffRL 42 161 0 16 Jun 2021
On Multi-objective Policy Optimization as a Tool for Reinforcement Learning: Case Studies in Offline RL and Finetuning A. Abdolmaleki Sandy H. Huang Giulia Vezzani Bobak Shahriari Jost Tobias Springenberg ... András Gyorgy Csaba Szepesvári R. Hadsell N. Heess Martin Riedmiller OffRL 11 5 0 15 Jun 2021
Residual Reinforcement Learning from Demonstrations Minttu Alakuijala Gabriel Dulac-Arnold Julien Mairal Jean Ponce Cordelia Schmid 8 25 0 15 Jun 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 25 778 0 12 Jun 2021
Offline Reinforcement Learning as Anti-Exploration Shideh Rezaeifar Robert Dadashi Nino Vieillard Léonard Hussenot Olivier Bachem Olivier Pietquin M. Geist OffRL 34 51 0 11 Jun 2021
Offline Inverse Reinforcement Learning Firas Jarboui Vianney Perchet OffRL 16 13 0 09 Jun 2021
Offline Reinforcement Learning as One Big Sequence Modeling Problem Michael Janner Qiyang Li Sergey Levine OffRL 66 645 0 03 Jun 2021
Decision Transformer: Reinforcement Learning via Sequence Modeling Lili Chen Kevin Lu Aravind Rajeswaran Kimin Lee Aditya Grover Michael Laskin Pieter Abbeel A. Srinivas Igor Mordatch OffRL 32 1,559 0 02 Jun 2021
What Matters for Adversarial Imitation Learning? Manu Orsini Anton Raichuk Léonard Hussenot Damien Vincent Robert Dadashi Sertan Girgin M. Geist Olivier Bachem Olivier Pietquin Marcin Andrychowicz 42 77 0 01 Jun 2021
Provable Representation Learning for Imitation with Contrastive Fourier Features Ofir Nachum Mengjiao Yang SSL OffRL 22 39 0 26 May 2021
Hyperparameter Selection for Imitation Learning Léonard Hussenot Marcin Andrychowicz Damien Vincent Robert Dadashi Anton Raichuk ... Sabela Ramos Manu Orsini Olivier Bachem M. Geist Olivier Pietquin 46 18 0 25 May 2021
Uncertainty Weighted Actor-Critic for Offline Reinforcement Learning Yue Wu Shuangfei Zhai Nitish Srivastava J. Susskind Jian Zhang Ruslan Salakhutdinov Hanlin Goh EDL OffRL OnRL 18 184 0 17 May 2021
Model-Based Offline Planning with Trajectory Pruning Xianyuan Zhan Xiangyu Zhu Haoran Xu OffRL 38 36 0 16 May 2021
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning Leandro M. de Lima R. Krohling OffRL 32 4 0 20 Apr 2021
Augmented World Models Facilitate Zero-Shot Dynamics Generalization From a Single Offline Environment Philip J. Ball Cong Lu Jack Parker-Holder Stephen J. Roberts OffRL 19 40 0 12 Apr 2021
Benchmarks for Deep Off-Policy Evaluation Justin Fu Mohammad Norouzi Ofir Nachum George Tucker Ziyun Wang ... Yutian Chen Aviral Kumar Cosmin Paduraru Sergey Levine T. Paine ELM OffRL 35 100 0 30 Mar 2021
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning Hiroki Furuta T. Matsushima Tadashi Kozuno Y. Matsuo Sergey Levine Ofir Nachum S. Gu OffRL 11 13 0 23 Mar 2021
Replacing Rewards with Examples: Example-Based Policy Search via Recursive Classification Benjamin Eysenbach Sergey Levine Ruslan Salakhutdinov OffRL 34 50 0 23 Mar 2021
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism Paria Rashidinejad Banghua Zhu Cong Ma Jiantao Jiao Stuart J. Russell OffRL 28 273 0 22 Mar 2021
Regularized Behavior Value Estimation Çağlar Gülçehre Sergio Gomez Colmenarejo Ziyun Wang Jakub Sygnowski T. Paine Konrad Zolna Yutian Chen Matthew W. Hoffman Razvan Pascanu Nando de Freitas OffRL 23 37 0 17 Mar 2021
Offline Reinforcement Learning with Fisher Divergence Critic Regularization Ilya Kostrikov Jonathan Tompson Rob Fergus Ofir Nachum OffRL 29 300 0 14 Mar 2021
S4RL: Surprisingly Simple Self-Supervision for Offline Reinforcement Learning Samarth Sinha Ajay Mandlekar Animesh Garg OffRL 26 104 0 10 Mar 2021
Offline Reinforcement Learning with Pseudometric Learning Robert Dadashi Shideh Rezaeifar Nino Vieillard Léonard Hussenot Olivier Pietquin M. Geist OffRL 31 40 0 02 Mar 2021
Reducing Conservativeness Oriented Offline Reinforcement Learning Hongchang Zhang Jianzhun Shao Yuhang Jiang Shuncheng He Xiangyang Ji OffRL 19 6 0 27 Feb 2021
DeepThermal: Combustion Optimization for Thermal Power Generating Units Using Offline Reinforcement Learning Xianyuan Zhan Haoran Xu Yueying Zhang Xiangyu Zhu Honglei Yin Yu Zheng OffRL AI4CE 38 67 0 23 Feb 2021
Uncertainty Estimation Using Riemannian Model Dynamics for Offline Reinforcement Learning Guy Tennenholtz Shie Mannor OffRL 21 11 0 22 Feb 2021
Continuous Doubly Constrained Batch Reinforcement Learning Rasool Fakoor Jonas W. Mueller Kavosh Asadi Pratik Chaudhari Alex Smola OffRL 204 27 0 18 Feb 2021
TradeR: Practical Deep Hierarchical Reinforcement Learning for Trade Execution Karush Suri Xiaolong Shi Konstantinos Plataniotis Y. Lawryshyn OffRL 18 4 0 16 Feb 2021
COMBO: Conservative Offline Model-Based Policy Optimization Tianhe Yu Aviral Kumar Rafael Rafailov Aravind Rajeswaran Sergey Levine Chelsea Finn OffRL 219 413 0 16 Feb 2021
Representation Matters: Offline Pretraining for Sequential Decision Making Mengjiao Yang Ofir Nachum SSL OffRL 13 119 0 11 Feb 2021
Risk-Averse Offline Reinforcement Learning Núria Armengol Urpí Sebastian Curi Andreas Krause OffRL 6 70 0 10 Feb 2021
rl_reach: Reproducible Reinforcement Learning Experiments for Robotic Reaching Tasks Pierre Aumjaud David McAuliffe Francisco J. Rodríguez-Lera P. Cardiff 11 10 0 09 Feb 2021
Measuring Progress in Deep Reinforcement Learning Sample Efficiency Florian E. Dorner 19 12 0 09 Feb 2021
Revisiting Prioritized Experience Replay: A Value Perspective Ang Li Zongqing Lu Chenglin Miao 16 9 0 05 Feb 2021
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning Rongjun Qin Songyi Gao Xingyuan Zhang Zhen Xu Shengkai Huang Zewen Li Weinan Zhang Yang Yu OffRL 132 78 0 01 Feb 2021
Is Pessimism Provably Efficient for Offline RL? Ying Jin Zhuoran Yang Zhaoran Wang OffRL 27 346 0 30 Dec 2020
POPO: Pessimistic Offline Policy Optimization Qiang He Xinwen Hou OffRL 24 10 0 26 Dec 2020
Offline Reinforcement Learning from Images with Latent Space Models Rafael Rafailov Tianhe Yu Aravind Rajeswaran Chelsea Finn OffRL 23 124 0 21 Dec 2020
Reset-Free Lifelong Learning with Skill-Space Planning Kevin Lu Aditya Grover Pieter Abbeel Igor Mordatch CLL OffRL 41 38 0 07 Dec 2020