D4RL: Datasets for Deep Data-Driven Reinforcement Learning

15 April 2020

Papers citing "D4RL: Datasets for Deep Data-Driven Reinforcement Learning"

50 / 927 papers shown

Title
Identifying Expert Behavior in Offline Training Datasets Improves Behavioral Cloning of Robotic Manipulation Policies Qiang-qiang Wang Robert McCarthy David Córdova Bulens Francisco Roldan Sanchez Kevin McGuinness Noel E. O'Connor S. Redmond OffRL 25 3 0 30 Jan 2023
Guiding Online Reinforcement Learning with Action-Free Offline Pretraining Deyao Zhu Yuhui Wang Jürgen Schmidhuber Mohamed Elhoseiny OffRL OnRL 41 8 0 30 Jan 2023
Direct Preference-based Policy Optimization without Reward Modeling Gaon An Junhyeok Lee Xingdong Zuo Norio Kosaka KyungHyun Kim Hyun Oh Song OffRL 29 26 0 30 Jan 2023
Importance Weighted Actor-Critic for Optimal Conservative Offline Reinforcement Learning Hanlin Zhu Paria Rashidinejad Jiantao Jiao OffRL 38 15 0 30 Jan 2023
SaFormer: A Conditional Sequence Modeling Approach to Offline Safe Reinforcement Learning Q. Zhang Linrui Zhang Haoran Xu Li Shen Bowen Wang Yongzhe Chang Xueqian Wang Bo Yuan Dacheng Tao OffRL 23 16 0 28 Jan 2023
Constrained Policy Optimization with Explicit Behavior Density for Offline Reinforcement Learning Jing Zhang Chi Zhang Wenjia Wang Bing-Yi Jing OffRL 32 7 0 28 Jan 2023
Variational Latent Branching Model for Off-Policy Evaluation Qitong Gao Ge Gao Min Chi Miroslav Pajic OffRL 36 6 0 28 Jan 2023
Improving Behavioural Cloning with Positive Unlabeled Learning Qiang-qiang Wang Robert McCarthy David Córdova Bulens Kevin McGuinness Noel E. O'Connor Nico Gürtler Felix Widmaier Francisco Roldan Sanchez S. Redmond OffRL OnRL 26 8 0 27 Jan 2023
Model-based Offline Reinforcement Learning with Local Misspecification Kefan Dong Yannis Flet-Berliac Allen Nie Emma Brunskill OffRL 18 4 0 26 Jan 2023
Which Experiences Are Influential for Your Agent? Policy Iteration with Turn-over Dropout Takuya Hiraoka Takashi Onishi Yoshimasa Tsuruoka OffRL 29 0 0 26 Jan 2023
Learning to View: Decision Transformers for Active Object Detection Wenhao Ding Nathalie Majcherczyk Mohit Deshpande Xuewei Qi Ding Zhao R. Madhivanan Arnie Sen OffRL 16 12 0 23 Jan 2023
Plan To Predict: Learning an Uncertainty-Foreseeing Model for Model-Based Reinforcement Learning Zifan Wu Chao Yu Chong Chen Jianye Hao H. Zhuo 13 16 0 20 Jan 2023
Learning Goal-Conditioned Policies Offline with Self-Supervised Reward Shaping Lina Mezghani Sainbayar Sukhbaatar Piotr Bojanowski A. Lazaric Alahari Karteek OffRL 44 18 0 05 Jan 2023
Learning-based MPC from Big Data Using Reinforcement Learning Shambhuraj Sawant Akhil S. Anand D. Reinhardt S. Gros OffRL 17 4 0 04 Jan 2023
Benchmarks and Algorithms for Offline Preference-Based Reward Learning Daniel Shin Anca Dragan Daniel S. Brown OffRL 17 53 0 03 Jan 2023
Contextual Conservative Q-Learning for Offline Reinforcement Learning Ke Jiang Jiayu Yao Xiaoyang Tan OffRL 17 0 0 03 Jan 2023
Policy Pre-training for Autonomous Driving via Self-supervised Geometric Modeling Peng Wu Li Chen Hongyang Li Xiaosong Jia Junchi Yan Yu Qiao 92 28 0 03 Jan 2023
Transformer in Transformer as Backbone for Deep Reinforcement Learning Hangyu Mao Rui Zhao Hao Chen Jianye Hao Yiqun Chen Dong Li Junge Zhang Zhen Xiao OffRL 36 8 0 30 Dec 2022
Offline Policy Optimization in RL with Variance Regularizaton Riashat Islam Samarth Sinha Homanga Bharadhwaj Samin Yeasar Arnob Zhuoran Yang Animesh Garg Zhaoran Wang Lihong Li Doina Precup OffRL 26 0 0 29 Dec 2022
On Transforming Reinforcement Learning by Transformer: The Development Trajectory Shengchao Hu Li Shen Ya Zhang Yixin Chen Dacheng Tao OffRL 27 25 0 29 Dec 2022
Understanding the Complexity Gains of Single-Task RL with a Curriculum Qiyang Li Yuexiang Zhai Yi Ma Sergey Levine 37 14 0 24 Dec 2022
I Cast Detect Thoughts: Learning to Converse and Guide with Intents and Theory-of-Mind in Dungeons and Dragons Pei Zhou Andrew Zhu Jennifer Hu Jay Pujara Xiang Ren Chris Callison-Burch Yejin Choi Prithviraj Ammanabrolu 18 26 0 20 Dec 2022
Offline Robot Reinforcement Learning with Uncertainty-Guided Human Expert Sampling Ashish Kumar Ilya Kuzovkin OffRL OnRL 37 1 0 16 Dec 2022
Bridging the Gap Between Offline and Online Reinforcement Learning Evaluation Methodologies Shivakanth Sujit Pedro H. M. Braga J. Bornschein Samira Ebrahimi Kahou OffRL 19 1 0 15 Dec 2022
Scaling Marginalized Importance Sampling to High-Dimensional State-Spaces via State Abstraction Brahma S. Pavse Josiah P. Hanna OffRL 32 7 0 14 Dec 2022
Reinforcement Learning in System Identification J. Antonio Martin H Oscar Fernández Sergio Pérez Anas Belfadil C. Ibáñez-Llano Freddy José Perozo Javier Valle Javier Arechalde Pelaz 17 0 0 14 Dec 2022
A Survey on Reinforcement Learning Security with Application to Autonomous Driving Ambra Demontis Maura Pintor Luca Demetrio Kathrin Grosse Hsiao-Ying Lin Chengfang Fang Battista Biggio Fabio Roli AAML 42 4 0 12 Dec 2022
Learning Options via Compression Yiding Jiang E. Liu Benjamin Eysenbach Zico Kolter Chelsea Finn OffRL 25 13 0 08 Dec 2022
PALMER: Perception-Action Loop with Memory for Long-Horizon Planning Onur Beker Mohammad Mohammadi Amir Zamir 37 2 0 08 Dec 2022
Model-based trajectory stitching for improved behavioural cloning and its applications Charles A. Hepburn Giovanni Montana OffRL 29 5 0 08 Dec 2022
Benchmarking Offline Reinforcement Learning Algorithms for E-Commerce Order Fraud Evaluation Soysal Degirmenci Chris Jones OffRL 22 1 0 05 Dec 2022
TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets Yuanying Cai Chuheng Zhang Li Zhao Wei Shen Xuyun Zhang Lei Song Jiang Bian Tao Qin Tie-Yan Liu OffRL 22 3 0 05 Dec 2022
Embedding Synthetic Off-Policy Experience for Autonomous Driving via Zero-Shot Curricula Eli Bronstein S. Srinivasan Supratik Paul Aman Sinha Matthew O'Kelly Payam Nikdel Shimon Whiteson OffRL 8 18 0 02 Dec 2022
Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery Yiqin Yang Haotian Hu Wenzhe Li Siyuan Li Jun Yang Qianchuan Zhao Chongjie Zhang OffRL 28 9 0 02 Dec 2022
Launchpad: Learning to Schedule Using Offline and Online RL Methods V. Venkataswamy J. E. Grigsby A. Grimshaw Yanjun Qi OffRL OnRL 18 1 0 01 Dec 2022
One Risk to Rule Them All: A Risk-Sensitive Perspective on Model-Based Offline Reinforcement Learning Marc Rigter Bruno Lacerda Nick Hawes OffRL 18 6 0 30 Nov 2022
Behavior Estimation from Multi-Source Data for Offline Reinforcement Learning Guoxi Zhang H. Kashima OffRL 29 2 0 29 Nov 2022
Offline Reinforcement Learning with Closed-Form Policy Improvement Operators Jiachen Li Edwin Zhang Ming Yin Qinxun Bai Yu-Xiang Wang William Yang Wang OffRL 36 15 0 29 Nov 2022
Is Conditional Generative Modeling all you need for Decision-Making? Anurag Ajay Yilun Du Abhi Gupta J. Tenenbaum Tommi Jaakkola Pulkit Agrawal DiffM 47 360 0 28 Nov 2022
Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes Aviral Kumar Rishabh Agarwal Xinyang Geng George Tucker Sergey Levine OffRL 44 48 0 28 Nov 2022
State-Aware Proximal Pessimistic Algorithms for Offline Reinforcement Learning Chong Chen Hongyao Tang Yi Ma Chao Wang Qianli Shen Dong Li Jianye Hao OffRL 31 0 0 28 Nov 2022
Domain Generalization for Robust Model-Based Offline Reinforcement Learning Alan Clark Shoaib Ahmed Siddiqui Robert Kirk Usman Anwar Stephen Chung David M. Krueger OOD OffRL 27 0 0 27 Nov 2022
How Crucial is Transformer in Decision Transformer? Max Siebenborn Boris Belousov Junning Huang Jan Peters 24 15 0 26 Nov 2022
On Instance-Dependent Bounds for Offline Reinforcement Learning with Linear Function Approximation Thanh Nguyen-Tang Ming Yin Sunil R. Gupta Svetha Venkatesh R. Arora OffRL 58 16 0 23 Nov 2022
Improving TD3-BC: Relaxed Policy Constraint for Offline Learning and Stable Online Fine-Tuning Alex Beeson Giovanni Montana OffRL OnRL 20 22 0 21 Nov 2022
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning Charles A. Hepburn Giovanni Montana OffRL 29 13 0 21 Nov 2022
Let Offline RL Flow: Training Conservative Agents in the Latent Space of Normalizing Flows D. Akimov Vladislav Kurenkov Alexander Nikulin Denis Tarasov Sergey Kolesnikov OffRL 19 9 0 20 Nov 2022
Q-Ensemble for Offline RL: Don't Scale the Ensemble, Scale the Batch Size Alexander Nikulin Vladislav Kurenkov Denis Tarasov Dmitry Akimov Sergey Kolesnikov OffRL 33 14 0 20 Nov 2022
UniMASK: Unified Inference in Sequential Decision Problems Micah Carroll Orr Paradise Jessy Lin Raluca Georgescu Mingfei Sun ... Stephanie Milani Katja Hofmann Matthew J. Hausknecht Anca Dragan Sam Devlin OffRL 26 21 0 20 Nov 2022
On the Effect of Pre-training for Transformer in Different Modality on Offline Reinforcement Learning S. Takagi OffRL 18 7 0 17 Nov 2022