Rainbow: Combining Improvements in Deep Reinforcement Learning

6 October 2017

Dan Horgan

Bilal Piot

M. G. Azar

David Silver

OffRL

ArXiv PDF HTML

Papers citing "Rainbow: Combining Improvements in Deep Reinforcement Learning"

50 / 362 papers shown

Title
Censored Deep Reinforcement Patrolling with Information Criterion for Monitoring Large Water Resources using Autonomous Surface Vehicles S. Luis Daniel Gutiérrez-Reina S. T. Marín 21 8 0 12 Oct 2022
Long N-step Surrogate Stage Reward to Reduce Variances of Deep Reinforcement Learning in Complex Problems Junmin Zhong Ruofan Wu J. Si LRM 30 0 0 10 Oct 2022
BAFFLE: Hiding Backdoors in Offline Reinforcement Learning Datasets Chen Gong Zhou Yang Yunru Bai Junda He Jieke Shi ... Arunesh Sinha Bowen Xu Xinwen Hou David Lo Guoliang Fan AAML OffRL 29 7 0 07 Oct 2022
Hyperbolic Deep Reinforcement Learning Edoardo Cetin B. Chamberlain Michael M. Bronstein Jonathan J. Hunt 48 21 0 04 Oct 2022
Interpretable Option Discovery using Deep Q-Learning and Variational Autoencoders Per-Arne Andersen Ole-Christoffer Granmo Morten Goodwin OOD 31 0 0 03 Oct 2022
Bayesian Q-learning With Imperfect Expert Demonstrations Fengdi Che Xiru Zhu Doina Precup David Meger Gregory Dudek 19 2 0 01 Oct 2022
Computational Discovery of Energy-Efficient Heat Treatment for Microstructure Design using Deep Reinforcement Learning J. Mianroodi N. Siboni Dierk Raabe AI4CE 40 2 0 22 Sep 2022
Pretraining the Vision Transformer using self-supervised methods for vision based Deep Reinforcement Learning Manuel Goulão Arlindo L. Oliveira ViT 45 6 0 22 Sep 2022
Revisiting Discrete Soft Actor-Critic Haibin Zhou Zichuan Lin Junyou Li Qiang Fu Wei Yang Deheng Ye 51 12 0 21 Sep 2022
Deep Generalized Schrödinger Bridge Guan-Horng Liu T. Chen Oswin So Evangelos A. Theodorou OT AI4CE 16 35 0 20 Sep 2022
Locally Constrained Representations in Reinforcement Learning Somjit Nath Rushiv Arora Samira Ebrahimi Kahou OOD OffRL 34 0 0 20 Sep 2022
MAN: Multi-Action Networks Learning Keqin Wang Alison Bartsch A. Farimani 21 3 0 19 Sep 2022
Reducing Variance in Temporal-Difference Value Estimation via Ensemble of Deep Networks Litian Liang Yaosheng Xu Stephen Marcus McAleer Dailin Hu Alexander Ihler Pieter Abbeel Roy Fox OOD 24 16 0 16 Sep 2022
Project proposal: A modular reinforcement learning based automated theorem prover Boris Shminke 23 1 0 06 Sep 2022
Transformers are Sample-Efficient World Models Vincent Micheli Eloi Alonso Franccois Fleuret VLM OffRL 19 163 0 01 Sep 2022
Dynamic Memory-based Curiosity: A Bootstrap Approach for Exploration Zijian Gao Yiying Li Kele Xu Yuanzhao Zhai Dawei Feng Bo Ding Xinjun Mao Huaimin Wang 38 0 0 24 Aug 2022
Reproducibility Report: Contrastive Learning of Socially-aware Motion Representations Roop Sen Sidharth Sinha Parv Maheshwari Animesh Jha Debashish Chakravarty 16 0 0 18 Aug 2022
Recurrent networks, hidden states and beliefs in partially observable environments Gaspard Lambrechts Adrien Bolland D. Ernst 25 12 0 06 Aug 2022
Learning to Generalize with Object-centric Agents in the Open World Survival Game Crafter Aleksandar Stanić Yujin Tang David R Ha Jürgen Schmidhuber ELM 29 13 0 05 Aug 2022
DRL-M4MR: An Intelligent Multicast Routing Approach Based on DQN Deep Reinforcement Learning in SDN Chenwei Zhao Miao Ye Xingsi Xue Jianhui Lv Qiuxiang Jiang Yong Wang 21 17 0 31 Jul 2022
Associative Memory Based Experience Replay for Deep Reinforcement Learning Mengyuan Li Arman Kazemi Ann Franchesca Laguna Sharon Hu VLM 21 8 0 16 Jul 2022
Stabilizing Off-Policy Deep Reinforcement Learning from Pixels Edoardo Cetin Philip J. Ball Steve Roberts Oya Celiktutan 35 36 0 03 Jul 2022
DayDreamer: World Models for Physical Robot Learning Philipp Wu Alejandro Escontrela Danijar Hafner Ken Goldberg Pieter Abbeel 61 277 0 28 Jun 2022
Does Self-supervised Learning Really Improve Reinforcement Learning from Pixels? Xiang Li Jinghuan Shang Srijan Das Michael S. Ryoo SSL 33 31 0 10 Jun 2022
Hub-Pathway: Transfer Learning from A Hub of Pre-trained Models Yang Shu Zhangjie Cao Ziyang Zhang Jianmin Wang Mingsheng Long 22 4 0 08 Jun 2022
Reincarnating Reinforcement Learning: Reusing Prior Computation to Accelerate Progress Rishabh Agarwal Max Schwarzer Pablo Samuel Castro Rameswar Panda Marc G. Bellemare OffRL OnRL 37 63 0 03 Jun 2022
Deep Transformer Q-Networks for Partially Observable Reinforcement Learning Kevin Esslinger Robert W. Platt Chris Amato OffRL 35 35 0 02 Jun 2022
Critic Sequential Monte Carlo Vasileios Lioutas J. Lavington Justice Sefas Matthew Niedoba Yunpeng Liu Berend Zwartsenberg Setareh Dabiri Frank Wood Adam Scibior 50 7 0 30 May 2022
Reinforcement Learning for Branch-and-Bound Optimisation using Retrospective Trajectories Christopher W. F. Parsonson Alexandre Laterre Thomas D. Barrett 25 19 0 28 May 2022
An Experimental Comparison Between Temporal Difference and Residual Gradient with Neural Network Approximation Shuyu Yin Tao Luo Peilin Liu Z. Xu 23 2 0 25 May 2022
MetaSlicing: A Novel Resource Allocation Framework for Metaverse N. Chu D. Hoang Diep N. Nguyen Khoa T. Phan E. Dutkiewicz Dusist Niyato Tao Shu 44 46 0 23 May 2022
Nuclear Norm Maximization Based Curiosity-Driven Learning Chao Chen Zijian Gao Kele Xu Sen Yang Yiying Li Bo Ding Dawei Feng Huaimin Wang 178 5 0 21 May 2022
The Sufficiency of Off-Policyness and Soft Clipping: PPO is still Insufficient according to an Off-Policy Measure Xing Chen Dongcui Diao Hechang Chen Hengshuai Yao Haiyin Piao Zhixiao Sun Zhiwei Yang Randy Goebel Bei Jiang Yi-Ju Chang OffRL 41 8 0 20 May 2022
Robust Losses for Learning Value Functions Andrew Patterson Victor Liao Martha White 28 12 0 17 May 2022
The Primacy Bias in Deep Reinforcement Learning Evgenii Nikishin Max Schwarzer P. DÓro Pierre-Luc Bacon Rameswar Panda OnRL 96 181 0 16 May 2022
Asking for Knowledge: Training RL Agents to Query External Knowledge Using Language Iou-Jen Liu Xingdi Yuan Marc-Alexandre Côté Pierre-Yves Oudeyer A. Schwing RALM 21 12 0 12 May 2022
Interactive Grounded Language Understanding in a Collaborative Environment: IGLU 2021 Julia Kiseleva Ziming Li Mohammad Aliannejadi Shrestha Mohanty Maartje ter Hoeve ... I. Churin Putra Manggala Kata Naszádi Michiel van der Meer Taewoon Kim LLMAG 33 30 0 05 May 2022
CCLF: A Contrastive-Curiosity-Driven Learning Framework for Sample-Efficient Reinforcement Learning Chenyu Sun Hangwei Qian Chunyan Miao OffRL 32 12 0 02 May 2022
Understanding and Preventing Capacity Loss in Reinforcement Learning Clare Lyle Mark Rowland Will Dabney CLL 36 110 0 20 Apr 2022
Automatically Learning Fallback Strategies with Model-Free Reinforcement Learning in Safety-Critical Driving Scenarios Ugo Lecerf Christelle Yemdji Tchassi S. Aubert Pietro Michiardi 26 0 0 11 Apr 2022
Federated Reinforcement Learning with Environment Heterogeneity Hao Jin Yang Peng Wenhao Yang Shusen Wang Zhihua Zhang 59 68 0 06 Apr 2022
Possibility Before Utility: Learning And Using Hierarchical Affordances Robby Costales Shariq Iqbal Fei Sha 29 5 0 23 Mar 2022
How to Learn from Risk: Explicit Risk-Utility Reinforcement Learning for Efficient and Safe Driving Strategies Lukas M. Schmidt Sebastian Rietsch Axel Plinge Bjoern M. Eskofier Christopher Mutschler OffRL 35 5 0 16 Mar 2022
Zipfian environments for Reinforcement Learning Stephanie C. Y. Chan Andrew Kyle Lampinen Pierre Harvey Richemond Felix Hill OffRL 15 15 0 15 Mar 2022
Orchestrated Value Mapping for Reinforcement Learning Mehdi Fatemi Arash Tavakoli 27 8 0 14 Mar 2022
Fast and Data Efficient Reinforcement Learning from Pixels via Non-Parametric Value Approximation Alex Long Alan Blair H. V. Hoof 26 3 0 07 Mar 2022
Coordinate-Aligned Multi-Camera Collaboration for Active Multi-Object Tracking Zeyu Fang Jian Zhao Mingyu Yang Wen-gang Zhou Zhenbo Lu Houqiang Li 28 10 0 22 Feb 2022
TransDreamer: Reinforcement Learning with Transformer World Models Changgu Chen Yi-Fu Wu Jaesik Yoon Sungjin Ahn OffRL 32 91 0 19 Feb 2022
Sequential Bayesian experimental designs via reinforcement learning Hikaru Asano OffRL 18 0 0 14 Feb 2022
Regularized Q-learning Han-Dong Lim Donghwan Lee 27 10 0 11 Feb 2022