Transient Non-Stationarity and Generalisation in Deep Reinforcement
Learning

Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning

10 June 2020

Gregory Farquhar

Jelena Luketina

Wendelin Boehmer

Shimon Whiteson

Papers citing "Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning"

19 / 19 papers shown

Title
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
Don't flatten, tokenize! Unlocking the key to SoftMoE's efficacy in deep RL Ghada Sokar J. Obando-Ceron Aaron C. Courville Hugo Larochelle Pablo Samuel Castro MoE 119 2 0 02 Oct 2024
SigmaRL: A Sample-Efficient and Generalizable Multi-Agent Reinforcement Learning Framework for Motion Planning Jianye Xu Pan Hu Bassam Alrifaee 42 5 0 14 Aug 2024
Can Learned Optimization Make Reinforcement Learning Less Difficult? Alexander David Goldie Chris Xiaoxuan Lu Matthew Jackson Shimon Whiteson Jakob N. Foerster 40 3 0 09 Jul 2024
Distilling Morphology-Conditioned Hypernetworks for Efficient Universal Morphology Control Zheng Xiong Risto Vuorio Jacob Beck Matthieu Zimmer Kun Shao Shimon Whiteson 34 1 0 09 Feb 2024
Directions of Curvature as an Explanation for Loss of Plasticity Alex Lewandowski Haruto Tanaka Dale Schuurmans Marlos C. Machado 11 5 0 30 Nov 2023
One is More: Diverse Perspectives within a Single Network for Efficient DRL Yiqin Tan Ling Pan Longbo Huang OffRL 30 0 0 21 Oct 2023
Maintaining Plasticity in Continual Learning via Regenerative Regularization Saurabh Kumar Henrik Marklund Benjamin Van Roy CLL KELM 26 15 0 23 Aug 2023
Improving Language Plasticity via Pretraining with Active Forgetting Yihong Chen Kelly Marchisio Roberta Raileanu David Ifeoluwa Adelani Pontus Stenetorp Sebastian Riedel Mikel Artetx KELM AI4CE CLL 28 23 0 03 Jul 2023
The Dormant Neuron Phenomenon in Deep Reinforcement Learning Ghada Sokar Rishabh Agarwal P. S. Castro Utku Evci CLL 40 88 0 24 Feb 2023
Which Experiences Are Influential for Your Agent? Policy Iteration with Turn-over Dropout Takuya Hiraoka Takashi Onishi Yoshimasa Tsuruoka OffRL 19 0 0 26 Jan 2023
SkillS: Adaptive Skill Sequencing for Efficient Temporally-Extended Exploration Giulia Vezzani Dhruva Tirumala Markus Wulfmeier Dushyant Rao A. Abdolmaleki ... Tim Hertweck Thomas Lampe Fereshteh Sadeghi N. Heess Martin Riedmiller OffRL 28 6 0 24 Nov 2022
Example When Local Optimal Policies Contain Unstable Control B. Song Jean-Jacques E. Slotine Quang-Cuong Pham 36 1 0 15 Sep 2022
Bayesian Generational Population-Based Training Xingchen Wan Cong Lu Jack Parker-Holder Philip J. Ball Vu-Linh Nguyen Binxin Ru Michael A. Osborne OffRL 26 15 0 19 Jul 2022
GriddlyJS: A Web IDE for Reinforcement Learning C. Bamford Minqi Jiang Mikayel Samvelyan Tim Rocktaschel OnRL 36 4 0 13 Jul 2022
When Does Re-initialization Work? Sheheryar Zaidi Tudor Berariu Hyunjik Kim J. Bornschein Claudia Clopath Yee Whye Teh Razvan Pascanu 35 10 0 20 Jun 2022
The Primacy Bias in Deep Reinforcement Learning Evgenii Nikishin Max Schwarzer P. DÓro Pierre-Luc Bacon Aaron C. Courville OnRL 90 178 0 16 May 2022
Understanding and Preventing Capacity Loss in Reinforcement Learning Clare Lyle Mark Rowland Will Dabney CLL 14 109 0 20 Apr 2022
Forgetting and Imbalance in Robot Lifelong Learning with Off-policy Data Wenxuan Zhou Steven Bohez Jan Humplik A. Abdolmaleki Dushyant Rao Markus Wulfmeier Tuomas Haarnoja N. Heess OffRL 32 6 0 12 Apr 2022