D4RL: Datasets for Deep Data-Driven Reinforcement Learning

15 April 2020

Papers citing "D4RL: Datasets for Deep Data-Driven Reinforcement Learning"

50 / 927 papers shown

Title
Balancing policy constraint and ensemble size in uncertainty-based offline reinforcement learning Alex Beeson Giovanni Montana OffRL 26 13 0 26 Mar 2023
Inverse Reinforcement Learning without Reinforcement Learning Gokul Swamy Sanjiban Choudhury J. Andrew Bagnell Zhiwei Steven Wu 21 34 0 26 Mar 2023
Optimal Transport for Offline Imitation Learning Yicheng Luo Zhengyao Jiang Samuel N. Cohen Edward Grefenstette M. Deisenroth OffRL 43 26 0 24 Mar 2023
Boosting Reinforcement Learning and Planning with Demonstrations: A Survey Tongzhou Mu H. Su OffRL 35 1 0 23 Mar 2023
Bridging Imitation and Online Reinforcement Learning: An Optimistic Tale Botao Hao Rahul Jain Dengwang Tang Zheng Wen OffRL 32 3 0 20 Mar 2023
A Survey of Demonstration Learning André Rosa de Sousa Porfírio Correia Luís A. Alexandre OffRL 36 17 0 20 Mar 2023
A Unified Framework of Policy Learning for Contextual Bandit with Confounding Bias and Missing Observations Siyu Chen Yitan Wang Zhaoran Wang Zhuoran Yang OffRL 36 2 0 20 Mar 2023
Goal-conditioned Offline Reinforcement Learning through State Space Partitioning Mianchu Wang Yue Jin Giovanni Montana OffRL 21 3 0 16 Mar 2023
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning Han Zheng Xufang Luo Pengfei Wei Xuan Song Dongsheng Li Jing Jiang OffRL OnRL 18 21 0 14 Mar 2023
Merging Decision Transformers: Weight Averaging for Forming Multi-Task Policies Daniel Lawson A. H. Qureshi MoMe OffRL 34 13 0 14 Mar 2023
Deploying Offline Reinforcement Learning with Human Feedback Ziniu Li Kelvin Xu Liu Liu Lanqing Li Deheng Ye P. Zhao OffRL 36 2 0 13 Mar 2023
Synthetic Experience Replay Cong Lu Philip J. Ball Yee Whye Teh Jack Parker-Holder OffRL 94 67 0 12 Mar 2023
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning Mitsuhiko Nakamoto Yuexiang Zhai Anika Singh Max Sobol Mark Yi Ma Chelsea Finn Aviral Kumar Sergey Levine OffRL OnRL 114 108 0 09 Mar 2023
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning Pengqin Wang Meixin Zhu Shaojie Shen OffRL 33 1 0 07 Mar 2023
Graph Decision Transformer Shengchao Hu Li Shen Ya Zhang Dacheng Tao OffRL 36 15 0 07 Mar 2023
Offline Imitation Learning with Suboptimal Demonstrations via Relaxed Distribution Matching Lantao Yu Tianhe Yu Jiaming Song W. Neiswanger Stefano Ermon OffRL 71 16 0 05 Mar 2023
Decision Transformer under Random Frame Dropping Kaizhe Hu Rachel Zheng Yang Gao Huazhe Xu OffRL 126 12 0 03 Mar 2023
Hallucinated Adversarial Control for Conservative Offline Policy Evaluation Jonas Rothfuss Bhavya Sukhija Tobias Birchler Parnian Kassraie Andreas Krause OffRL 13 10 0 02 Mar 2023
Preference Transformer: Modeling Human Preferences using Transformers for RL Changyeon Kim Jongjin Park Jinwoo Shin Honglak Lee Pieter Abbeel Kimin Lee OffRL 41 62 0 02 Mar 2023
The Virtues of Laziness in Model-based RL: A Unified Objective and Algorithms Anirudh Vemula Yuda Song Aarti Singh J. Andrew Bagnell Sanjiban Choudhury OffRL 33 11 0 01 Mar 2023
Learning to Control Autonomous Fleets from Observation via Offline Reinforcement Learning Carolin Schmidt Daniele Gammelli Francisco Câmara Pereira Filipe Rodrigues OffRL 14 4 0 28 Feb 2023
Hierarchical Reinforcement Learning in Complex 3D Environments Bernardo Avila-Pires Feryal M. P. Behbahani Hubert Soyer Kyriacos Nikiforou Thomas Keck Satinder Singh OffRL 23 0 0 28 Feb 2023
The In-Sample Softmax for Offline Reinforcement Learning Chenjun Xiao Han Wang Yangchen Pan Adam White Martha White OffRL 29 26 0 28 Feb 2023
Learning Sparse Control Tasks from Pixels by Latent Nearest-Neighbor-Guided Explorations Ruihan Zhao Ufuk Topcu Sandeep P. Chinchali Mariano Phielipp 22 3 0 28 Feb 2023
The Provable Benefits of Unsupervised Data Sharing for Offline Reinforcement Learning Haotian Hu Yiqin Yang Qianchuan Zhao Chongjie Zhang OffRL 11 5 0 27 Feb 2023
Diffusion Model-Augmented Behavioral Cloning Shangcheng Chen Hsiang-Chun Wang Ming-Hao Hsu Chun-Mao Lai Shao-Hua Sun DiffM 55 31 0 26 Feb 2023
VIPeR: Provably Efficient Algorithm for Offline RL with Neural Function Approximation Thanh Nguyen-Tang R. Arora OffRL 46 5 0 24 Feb 2023
Neural Laplace Control for Continuous-time Delayed Systems Samuel Holt Alihan Huyuk Zhaozhi Qian Hao Sun M. Schaar OffRL 29 10 0 24 Feb 2023
To the Noise and Back: Diffusion for Shared Autonomy Takuma Yoneda Luzhe Sun Ge Yang Bradly C. Stadie Matthew R. Walter DiffM 30 27 0 23 Feb 2023
Behavior Proximal Policy Optimization Zifeng Zhuang Kun Lei Jinxin Liu Donglin Wang Yilang Guo OffRL 30 34 0 22 Feb 2023
Adversarial Model for Offline Reinforcement Learning M. Bhardwaj Tengyang Xie Byron Boots Nan Jiang Ching-An Cheng AAML OffRL 37 26 0 21 Feb 2023
Efficient Communication via Self-supervised Information Aggregation for Online and Offline Multi-agent Reinforcement Learning Cong Guan F. Chen Lei Yuan Zongzhang Zhang Yang Yu OffRL 37 4 0 19 Feb 2023
HOPE: Human-Centric Off-Policy Evaluation for E-Learning and Healthcare Ge Gao Song Ju Markel Sanz Ausin Min Chi OffRL 29 8 0 18 Feb 2023
Swapped goal-conditioned offline reinforcement learning Wenyan Yang Huiling Wang Dingding Cai Joni Pajarinen Joni-Kristen Kämäräinen OffRL OnRL 36 1 0 17 Feb 2023
Dual RL: Unification and New Methods for Reinforcement and Imitation Learning Harshit S. Sikchi Qinqing Zheng Amy Zhang S. Niekum OffRL 36 19 0 16 Feb 2023
When Demonstrations Meet Generative World Models: A Maximum Likelihood Framework for Offline Inverse Reinforcement Learning Siliang Zeng Chenliang Li Alfredo García Min-Fong Hong OffRL 34 13 0 15 Feb 2023
Constrained Decision Transformer for Offline Safe Reinforcement Learning Zuxin Liu Zijian Guo Yi-Fan Yao Zhepeng Cen Wenhao Yu Tingnan Zhang Ding Zhao OffRL 31 47 0 14 Feb 2023
Conservative State Value Estimation for Offline Reinforcement Learning Liting Chen Jie Yan Zhengdao Shao Lu Wang Qingwei Lin Saravan Rajmohan Thomas Moscibroda Dongmei Zhang OffRL 26 6 0 14 Feb 2023
CLARE: Conservative Model-Based Reward Learning for Offline Inverse Reinforcement Learning Sheng Yue Guan-Bo Wang Wei Shao Zhaofeng Zhang Sen Lin Junkai Ren Junshan Zhang OffRL 31 20 0 09 Feb 2023
Efficient Online Reinforcement Learning with Offline Data Philip J. Ball Laura M. Smith Ilya Kostrikov Sergey Levine OffRL OnRL 34 163 0 06 Feb 2023
A Strong Baseline for Batch Imitation Learning Matthew Smith Lucas Maystre Zhenwen Dai K. Ciosek OffRL 25 4 0 06 Feb 2023
AdaptDiffuser: Diffusion Models as Adaptive Self-evolving Planners Zhixuan Liang Yao Mu Mingyu Ding Fei Ni Masayoshi Tomizuka Ping Luo 80 101 0 03 Feb 2023
Mind the Gap: Offline Policy Optimization for Imperfect Rewards Jianxiong Li Xiao Hu Haoran Xu Jingjing Liu Xianyuan Zhan Qing-Shan Jia Ya Zhang OffRL 38 19 0 03 Feb 2023
Policy Expansion for Bridging Offline-to-Online Reinforcement Learning Haichao Zhang Weiwen Xu Haonan Yu CLL OffRL OnRL 40 62 0 02 Feb 2023
Off-the-Grid MARL: Datasets with Baselines for Offline Multi-Agent Reinforcement Learning Claude Formanek Asad Jeewa Jonathan P. Shock Arnu Pretorius OffRL 43 1 0 01 Feb 2023
QMP: Q-switch Mixture of Policies for Multi-Task Behavior Sharing Grace Zhang Ayush Jain Injune Hwang Shao-Hua Sun Joseph J. Lim 22 5 0 01 Feb 2023
Revisiting Bellman Errors for Offline Model Selection Joshua P. Zitovsky Daniel de Marchi Rishabh Agarwal Michael R. Kosorok University of North Carolina at Chapel Hill OffRL 32 5 0 31 Jan 2023
Efficient Policy Evaluation with Offline Data Informed Behavior Policy Design Shuze Liu Shangtong Zhang OffRL 32 3 0 31 Jan 2023
Anti-Exploration by Random Network Distillation Alexander Nikulin Vladislav Kurenkov Denis Tarasov Sergey Kolesnikov 38 24 0 31 Jan 2023
Skill Decision Transformer Shyam Sudhakaran S. Risi OffRL 26 5 0 31 Jan 2023