Rainbow: Combining Improvements in Deep Reinforcement Learning

6 October 2017

Dan Horgan

Bilal Piot

M. G. Azar

David Silver

OffRL

ArXiv PDF HTML

Papers citing "Rainbow: Combining Improvements in Deep Reinforcement Learning"

50 / 362 papers shown

Title
Why Should I Trust You, Bellman? The Bellman Error is a Poor Replacement for Value Error Scott Fujimoto David Meger Doina Precup Ofir Nachum S. Gu 30 32 0 28 Jan 2022
Planning and Learning with Adaptive Lookahead Aviv A. Rosenberg Assaf Hallak Shie Mannor Gal Chechik Gal Dalal 27 7 0 28 Jan 2022
Mask-based Latent Reconstruction for Reinforcement Learning Tao Yu Zhizheng Zhang Cuiling Lan Yan Lu Zhibo Chen 24 44 0 28 Jan 2022
Quantile-Based Policy Optimization for Reinforcement Learning Jinyang Jiang Jiaqiao Hu Yijie Peng 33 7 0 27 Jan 2022
From Psychological Curiosity to Artificial Curiosity: Curiosity-Driven Learning in Artificial Intelligence Tasks Chenyu Sun Hangwei Qian Chunyan Miao 18 10 0 20 Jan 2022
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems Jack Parker-Holder Raghunandan Rajan Xingyou Song André Biedenkapp Yingjie Miao ... Vu-Linh Nguyen Roberto Calandra Aleksandra Faust Frank Hutter Marius Lindauer AI4CE 33 100 0 11 Jan 2022
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning Tong Mu Georgios Theocharous David Arbour Emma Brunskill 33 6 0 30 Dec 2021
Sample-Efficient Reinforcement Learning via Conservative Model-Based Actor-Critic Zhihai Wang Jie Wang Qi Zhou Bin Li Houqiang Li 27 30 0 16 Dec 2021
Human-Level Control through Directly-Trained Deep Spiking Q-Networks Guisong Liu Wenjie Deng Xiurui Xie Li Huang Huajin Tang OffRL 27 43 0 13 Dec 2021
Godot Reinforcement Learning Agents E. Beeching Jilles Debangoye Olivier Simonin Christian Wolf GP OnRL 24 5 0 07 Dec 2021
JueWu-MC: Playing Minecraft with Sample-efficient Hierarchical Reinforcement Learning Zichuan Lin Junyou Li Jianing Shi Deheng Ye Qiang Fu Wei Yang BDL 45 34 0 07 Dec 2021
ED2: Environment Dynamics Decomposition World Models for Continuous Control Jianye Hao Yifu Yuan Cong Wang Zhen Wang OffRL 16 1 0 06 Dec 2021
Reinforcement Learning-based Switching Controller for a Milliscale Robot in a Constrained Environment Abbas Tariverdi Ulysse Côté-Allard Kim Mathiassen O. Elle H. Kalvøy Ø. Martinsen J. Tørresen 16 4 0 27 Nov 2021
Adaptively Calibrated Critic Estimates for Deep Reinforcement Learning Nicolai Dorka Tim Welschehold Joschka Boedecker Wolfram Burgard OffRL 30 9 0 24 Nov 2021
Episodic Multi-agent Reinforcement Learning with Curiosity-Driven Exploration Lu Zheng Jiarui Chen Jianhao Wang Jiamin He Yujing Hu Yingfeng Chen Changjie Fan Yang Gao Chongjie Zhang 16 82 0 22 Nov 2021
GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving Raphael Chekroun Marin Toromanoff Sascha Hornauer Fabien Moutarde 39 60 0 16 Nov 2021
Obstacle Avoidance for UAS in Continuous Action Space Using Deep Reinforcement Learning Jueming Hu Xuxi Yang Weichang Wang Peng Wei Lei Ying Yongming Liu 43 24 0 13 Nov 2021
Deep Reinforcement Model Selection for Communications Resource Allocation in On-Site Medical Care Steffen Gracla Edgar Beck C. Bockelmann Armin Dekorsy 29 1 0 12 Nov 2021
CubeTR: Learning to Solve The Rubiks Cube Using Transformers Mustafa Chasmai ViT 37 1 0 11 Nov 2021
Hybrid BYOL-ViT: Efficient approach to deal with small datasets Safwen Naimi Rien van Leeuwen W. Souidène S. B. Saoud SSL ViT 25 2 0 08 Nov 2021
d3rlpy: An Offline Deep Reinforcement Learning Library Takuma Seno M. Imai OffRL GP 62 100 0 06 Nov 2021
Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon Reasoning Dhruv Shah Peng Xu Yao Lu Ted Xiao Alexander Toshev Sergey Levine Brian Ichter OffRL 37 41 0 04 Nov 2021
Mastering Atari Games with Limited Data Weirui Ye Shao-Wei Liu Thanard Kurutach Pieter Abbeel Yang Gao VLM 42 226 0 30 Oct 2021
The Difficulty of Passive Learning in Deep Reinforcement Learning Georg Ostrovski Pablo Samuel Castro Will Dabney OffRL 19 57 0 26 Oct 2021
On games and simulators as a platform for development of artificial intelligence for command and control Vinicius G. Goecks Nicholas R. Waytowich Derrik E. Asher Song Jun Park Mark R. Mittrick ... Anne Logie Mark S. Dennison T. Trout Priya Narayanan Alexander Kott 38 26 0 21 Oct 2021
GrowSpace: Learning How to Shape Plants Yasmeen Hitti Ionelia Buzatu Manuel Del Verme M. Lefsrud Florian Golemo A. Durand 19 2 0 15 Oct 2021
NeurIPS 2021 Competition IGLU: Interactive Grounded Language Understanding in a Collaborative Environment Julia Kiseleva Ziming Li Mohammad Aliannejadi Shrestha Mohanty Maartje ter Hoeve ... Arthur Szlam Yuxuan Sun Katja Hofmann Michel Galley Ahmed Hassan Awadallah LLMAG 70 15 0 13 Oct 2021
Learning Pessimism for Robust and Efficient Off-Policy Reinforcement Learning Edoardo Cetin Oya Celiktutan OffRL 42 17 0 07 Oct 2021
Explaining Deep Reinforcement Learning Agents In The Atari Domain through a Surrogate Model Alexander Sieusahai Matthew J. Guzdial 35 13 0 07 Oct 2021
Learning Multi-Objective Curricula for Robotic Policy Learning Jikun Kang Miao Liu Abhinav Gupta C. Pal Xue Liu Jie Fu 42 4 0 06 Oct 2021
Deep reinforcement learning for guidewire navigation in coronary artery phantom Jihoon Kweon Kyunghwan Kim Chaehyuk Lee Hwi Kwon Jinwoo Park ... Inwook Back J. Roh Y. Moon Jaesoon Choi Young-Hak Kim OnRL 21 33 0 05 Oct 2021
Large Batch Experience Replay Thibault Lahire M. Geist Emmanuel Rachelson OffRL 56 13 0 04 Oct 2021
On the Estimation Bias in Double Q-Learning Zhizhou Ren Guangxiang Zhu Haotian Hu Beining Han Jian-Hai Chen Chongjie Zhang 24 17 0 29 Sep 2021
Prioritized Experience-based Reinforcement Learning with Human Guidance for Autonomous Driving Jingda Wu Zhiyu Huang Wenhui Huang Chen Lv 52 74 0 26 Sep 2021
The $f$ -Divergence Reinforcement Learning Framework Chen Gong Qiang He Yunpeng Bai Zhouyi Yang Xiaoyu Chen Xinwen Hou Xianjie Zhang Yu Liu Guoliang Fan 34 3 0 24 Sep 2021
Improved Soft Actor-Critic: Mixing Prioritized Off-Policy Samples with On-Policy Experience C. Banerjee Zhiyong Chen N. Noman 19 30 0 24 Sep 2021
On Bonus-Based Exploration Methods in the Arcade Learning Environment Adrien Ali Taïga W. Fedus Marlos C. Machado Aaron Courville Marc G. Bellemare 21 58 0 22 Sep 2021
RAPID-RL: A Reconfigurable Architecture with Preemptive-Exits for Efficient Deep-Reinforcement Learning Adarsh Kosta Malik Aqeel Anwar Priyadarshini Panda A. Raychowdhury Kaushik Roy 13 4 0 16 Sep 2021
Benchmarking the Spectrum of Agent Capabilities Danijar Hafner ELM 33 128 0 14 Sep 2021
Theoretical Guarantees of Fictitious Discount Algorithms for Episodic Reinforcement Learning and Global Convergence of Policy Gradient Methods Xin Guo Anran Hu Junzi Zhang OffRL 31 6 0 13 Sep 2021
An Empirical Comparison of Off-policy Prediction Learning Algorithms in the Four Rooms Environment Sina Ghiassian R. Sutton AAML OffRL 16 6 0 10 Sep 2021
An Oracle and Observations for the OpenAI Gym / ALE Freeway Environment J. Plank Catherine D. Schuman Robert M. Patton 26 0 0 02 Sep 2021
Interactive Machine Comprehension with Dynamic Knowledge Graphs Xingdi Yuan 34 3 0 31 Aug 2021
APS: Active Pretraining with Successor Features Hao Liu Pieter Abbeel 50 119 0 31 Aug 2021
Deep Reinforcement Learning at the Edge of the Statistical Precipice Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Aaron Courville Marc G. Bellemare OffRL 59 639 0 30 Aug 2021
Implicitly Regularized RL with Implicit Q-Values Nino Vieillard Marcin Andrychowicz Anton Raichuk Olivier Pietquin M. Geist OffRL 24 9 0 16 Aug 2021
Graph Attention Network-based Multi-agent Reinforcement Learning for Slicing Resource Management in Dense Cellular Network Yan Shao Rongpeng Li Bing Hu Yingxiao Wu Zhifeng Zhao Honggang Zhang 36 46 0 11 Aug 2021
High Performance Across Two Atari Paddle Games Using the Same Perceptual Control Architecture Without Training T. Gulrez W. Mansell 19 0 0 04 Aug 2021
Physics-informed Dyna-Style Model-Based Deep Reinforcement Learning for Dynamic Control Xin-Yang Liu Jian-Xun Wang AI4CE 31 38 0 31 Jul 2021
Mastering Visual Continuous Control: Improved Data-Augmented Reinforcement Learning Denis Yarats Rob Fergus A. Lazaric Lerrel Pinto OffRL 36 338 0 20 Jul 2021