BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning

27 October 2019

Papers citing "BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning"

33 / 33 papers shown

Title
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making Jake Grigsby Yuke Zhu Michael S Ryoo Juan Carlos Niebles OffRL VLM 41 0 0 06 May 2025
ACL-QL: Adaptive Conservative Level in Q-Learning for Offline Reinforcement Learning Kun Wu Yinuo Zhao Zhihao Xu Zhengping Che Chengxiang Yin C. Liu Qinru Qiu Feiferi Feng OffRL 102 1 0 22 Dec 2024
Solving Continual Offline RL through Selective Weights Activation on Aligned Spaces Jifeng Hu Sili Huang Li Shen Zhejian Yang Shengchao Hu Shisong Tang H. Chen Yi-Ju Chang Dacheng Tao Lichao Sun OffRL 39 0 0 21 Oct 2024
UDQL: Bridging The Gap between MSE Loss and The Optimal Value Function in Offline Reinforcement Learning Yu Zhang Rui Yu Zhipeng Yao Wenyuan Zhang Jun Wang Liming Zhang OffRL 53 0 0 05 Jun 2024
Towards Robust Policy: Enhancing Offline Reinforcement Learning with Adversarial Attacks and Defenses Thanh Nguyen Tung M. Luu Tri Ton Chang D. Yoo OffRL AAML 34 0 0 18 May 2024
IBCB: Efficient Inverse Batched Contextual Bandit for Behavioral Evolution History Yi Xu Weiran Shen Xiao Zhang Jun Xu OffRL 41 0 0 24 Mar 2024
Transductive Reward Inference on Graph B. Qu Xiaofeng Cao Qing Guo Yi Chang Ivor W. Tsang Chengqi Zhang OffRL 38 0 0 06 Feb 2024
Zero-Shot Reinforcement Learning from Low Quality Data Scott Jeen Tom Bewley Jonathan M. Cullen OffRL OnRL 36 0 0 26 Sep 2023
Hundreds Guide Millions: Adaptive Offline Reinforcement Learning with Expert Guidance Qisen Yang Shenzhi Wang Qihang Zhang Gao Huang Shiji Song OffRL OnRL 26 8 0 04 Sep 2023
Benchmarking Offline Reinforcement Learning on Real-Robot Hardware Nico Gürtler Sebastian Blaes Pavel Kolev Felix Widmaier Manuel Wüthrich Stefan Bauer Bernhard Schölkopf Georg Martius OffRL 33 28 0 28 Jul 2023
Federated Ensemble-Directed Offline Reinforcement Learning Desik Rengarajan N. Ragothaman D. Kalathil S. Shakkottai OffRL 32 1 0 04 May 2023
Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu Li Jiang Jianxiong Li Zhuoran Yang Zhaoran Wang Victor Chan Xianyuan Zhan OffRL 36 71 0 28 Mar 2023
Risk-Averse MDPs under Reward Ambiguity Haolin Ruan Zhi Chen C. Ho 35 2 0 03 Jan 2023
Dual Generator Offline Reinforcement Learning Q. Vuong Aviral Kumar Sergey Levine Yevgen Chebotar OffRL 28 1 0 02 Nov 2022
Boosting Offline Reinforcement Learning via Data Rebalancing Yang Yue Bingyi Kang Xiao Ma Zhongwen Xu Gao Huang Shuicheng Yan OffRL 26 22 0 17 Oct 2022
A Policy-Guided Imitation Approach for Offline Reinforcement Learning Haoran Xu Li Jiang Jianxiong Li Xianyuan Zhan OffRL 26 61 0 15 Oct 2022
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation Xiaoteng Ma Zhipeng Liang Jose H. Blanchet MingWen Liu Li Xia Jiheng Zhang Qianchuan Zhao Zhengyuan Zhou OOD OffRL 41 22 0 14 Sep 2022
Offline Equilibrium Finding Shuxin Li Xinrun Wang Youzhi Zhang Jakub Cerny Pengdeng Li Hau Chan Bo An OffRL 43 2 0 12 Jul 2022
A Survey on Model-based Reinforcement Learning Fan Luo Tian Xu Hang Lai Xiong-Hui Chen Weinan Zhang Yang Yu OffRL LRM 50 101 0 19 Jun 2022
User-Interactive Offline Reinforcement Learning Phillip Swazinna Steffen Udluft Thomas Runkler OffRL 25 11 0 21 May 2022
BATS: Best Action Trajectory Stitching I. Char Viraj Mehta Adam R. Villaflor John M. Dolan J. Schneider OffRL 30 8 0 26 Apr 2022
DARA: Dynamics-Aware Reward Augmentation in Offline Reinforcement Learning Jinxin Liu Hongyin Zhang Donglin Wang OffRL 38 32 0 13 Mar 2022
Quantile Filtered Imitation Learning David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna 30 6 0 02 Dec 2021
Curriculum Offline Imitation Learning Minghuan Liu Hanye Zhao Zhengyu Yang Jian Shen Weinan Zhang Li Zhao Tie-Yan Liu OffRL 29 1 0 03 Nov 2021
A Closer Look at Advantage-Filtered Behavioral Cloning in High-Noise Datasets J. E. Grigsby Yanjun Qi OffRL 24 5 0 10 Oct 2021
Offline RL Without Off-Policy Evaluation David Brandfonbrener William F. Whitney Rajesh Ranganath Joan Bruna OffRL 42 162 0 16 Jun 2021
A Minimalist Approach to Offline Reinforcement Learning Scott Fujimoto S. Gu OffRL 58 780 0 12 Jun 2021
NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning Rongjun Qin Songyi Gao Xingyuan Zhang Zhen Xu Shengkai Huang Zewen Li Weinan Zhang Yang Yu OffRL 137 6 0 01 Feb 2021
Semi-supervised reward learning for offline reinforcement learning Ksenia Konyushkova Konrad Zolna Y. Aytar Alexander Novikov Scott E. Reed Serkan Cabi Nando de Freitas SSL OffRL 68 23 0 12 Dec 2020
Offline Learning from Demonstrations and Unlabeled Experience Konrad Zolna Alexander Novikov Ksenia Konyushkova Çağlar Gülçehre Ziyun Wang Y. Aytar Misha Denil Nando de Freitas Scott E. Reed SSL OffRL 32 66 0 27 Nov 2020
Critic Regularized Regression Ziyun Wang Alexander Novikov Konrad Zolna Jost Tobias Springenberg Scott E. Reed ... Noah Y. Siegel J. Merel Çağlar Gülçehre N. Heess Nando de Freitas OffRL 36 317 0 26 Jun 2020
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems Sergey Levine Aviral Kumar George Tucker Justin Fu OffRL GP 340 1,960 0 04 May 2020
An empirical investigation of the challenges of real-world reinforcement learning Gabriel Dulac-Arnold Nir Levine D. Mankowitz Jerry Li Cosmin Paduraru Sven Gowal Todd Hester OffRL 34 120 0 24 Mar 2020