Bigger, Better, Faster: Human-level Atari with human-level efficiency

30 May 2023

Papers citing "Bigger, Better, Faster: Human-level Atari with human-level efficiency"

50 / 66 papers shown

Title
Plasticity-Aware Mixture of Experts for Learning Under QoE Shifts in Adaptive Video Streaming Zhiqiang He Zhi Liu 36 0 0 14 Apr 2025
Multi-Task Reinforcement Learning Enables Parameter Scaling Reginald McLean Evangelos Chataroulas Jordan Terry Isaac Woungang Nariman Farsad P. S. Castro LRM 39 0 0 07 Mar 2025
Impoola: The Power of Average Pooling for Image-Based Deep Reinforcement Learning Raphael Trumpp Ansgar Schäfftlein Mirco Theile Marco Caccamo 34 0 0 07 Mar 2025
Learning Transformer-based World Models with Contrastive Predictive Coding Maxime Burchi Radu Timofte 62 0 0 06 Mar 2025
Eau De $Q$ -Network: Adaptive Distillation of Neural Networks in Deep Reinforcement Learning Théo Vincent Tim Lukas Faust Yogesh Tripathi Jan Peters Carlo DÉramo 32 0 0 03 Mar 2025
Hyperspherical Normalization for Scalable Deep Reinforcement Learning Hojoon Lee Youngdo Lee Takuma Seno Donghu Kim Peter Stone Jaegul Choo 63 1 0 24 Feb 2025
A Large Recurrent Action Model: xLSTM enables Fast Inference for Robotics Tasks Thomas Schmied Thomas Adler Vihang Patil M. Beck Korbinian Poppel Johannes Brandstetter G. Klambauer Razvan Pascanu Sepp Hochreiter 70 4 0 21 Feb 2025
Towards General-Purpose Model-Free Reinforcement Learning Scott Fujimoto P. DÓro Amy Zhang Yuandong Tian Michael Rabbat OffRL 34 3 0 28 Jan 2025
Learning Versatile Optimizers on a Compute Diet A. Moudgil Boris Knyazev Guillaume Lajoie Eugene Belilovsky 63 0 0 22 Jan 2025
ReZero: Boosting MCTS-based Algorithms by Backward-view and Entire-buffer Reanalyze Chunyu Xuan Yazhe Niu Yuan Pu Shuai Hu Yu Liu Jing Yang 51 0 0 03 Jan 2025
Reinforcement Learning with a Focus on Adjusting Policies to Reach Targets Akane Tsuboya Yu Kono Tatsuji Takahashi 25 0 0 23 Dec 2024
Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps Benjamin Ellis Matthew Jackson Andrei Lupu Alexander David Goldie Mattie Fellows Shimon Whiteson Jakob Foerster 74 0 0 22 Dec 2024
Enabling Realtime Reinforcement Learning at Scale with Staggered Asynchronous Inference Matthew D Riemer G. Subbaraj Glen Berseth Irina Rish OffRL 66 1 0 18 Dec 2024
Breaking the Reclustering Barrier in Centroid-based Deep Clustering Lukas Miklautz Timo Klein Kevin Sidak Collin Leiber Thomas Lang Andrii Shkabrii Sebastian Tschiatschek Claudia Plant 29 0 0 04 Nov 2024
CALE: Continuous Arcade Learning Environment Jesse Farebrother Pablo Samuel Castro ELM 31 0 0 31 Oct 2024
SigCLR: Sigmoid Contrastive Learning of Visual Representations Ömer Veysel Çağatan 13 0 0 22 Oct 2024
Streaming Deep Reinforcement Learning Finally Works Mohamed Elsayed G. Vasan A. R. Mahmood OffRL 35 4 0 18 Oct 2024
SimBa: Simplicity Bias for Scaling Up Parameters in Deep Reinforcement Learning Hojoon Lee Dongyoon Hwang Donghu Kim Hyunseung Kim Jun Jet Tai K. Subramanian Peter R. Wurman Jaegul Choo Peter Stone Takuma Seno OffRL 60 6 0 13 Oct 2024
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
Neuroplastic Expansion in Deep Reinforcement Learning Jiashun Liu J. Obando-Ceron Aaron C. Courville L. Pan 31 3 0 10 Oct 2024
Retrieval-Augmented Decision Transformer: External Memory for In-context RL Thomas Schmied Fabian Paischer Vihang Patil M. Hofmarcher Razvan Pascanu Sepp Hochreiter OffRL 28 6 0 09 Oct 2024
Learning in complex action spaces without policy gradients Arash Tavakoli Sina Ghiassian Nemanja Rakićević OffRL 23 0 0 08 Oct 2024
Don't flatten, tokenize! Unlocking the key to SoftMoE's efficacy in deep RL Ghada Sokar J. Obando-Ceron Aaron C. Courville Hugo Larochelle Pablo Samuel Castro MoE 54 2 0 02 Oct 2024
Mitigating the Stability-Plasticity Dilemma in Adaptive Train Scheduling with Curriculum-Driven Continual DQN Expansion Achref Jaziri Etienne Kunzel Visvanathan Ramesh CLL 42 0 0 19 Aug 2024
Can Learned Optimization Make Reinforcement Learning Less Difficult? Alexander David Goldie Chris Xiaoxuan Lu Matthew Jackson Shimon Whiteson Jakob N. Foerster 37 3 0 09 Jul 2024
Generalizing soft actor-critic algorithms to discrete action spaces Le Zhang Yong Gu Xin Zhao Yanshuo Zhang Shu Zhao Yifei Jin Xinxin Wu 26 0 0 08 Jul 2024
Efficient World Models with Context-Aware Tokenization Vincent Micheli Eloi Alonso François Fleuret OffRL VLM 27 4 0 27 Jun 2024
Mixture of Experts in a Mixture of RL settings Timon Willi J. Obando-Ceron Jakob Foerster Karolina Dziugaite Pablo Samuel Castro MoE 37 7 0 26 Jun 2024
On the consistency of hyper-parameter selection in value-based deep reinforcement learning J. Obando-Ceron J. G. Araújo Aaron C. Courville Pablo Samuel Castro 37 5 0 25 Jun 2024
UniZero: Generalized and Efficient Planning with Scalable Latent World Models Yuan Pu Yazhe Niu Jiyuan Ren Zhenjie Yang Hongsheng Li Yu Liu OffRL 38 1 0 15 Jun 2024
Investigating Pre-Training Objectives for Generalization in Vision-Based Reinforcement Learning Donghu Kim Hojoon Lee Kyungmin Lee Dongyoon Hwang Jaegul Choo OffRL 29 1 0 10 Jun 2024
A Study of Plasticity Loss in On-Policy Deep Reinforcement Learning Arthur Juliani Jordan T. Ash OffRL OnRL CLL 38 5 0 29 May 2024
Position: Foundation Agents as the Paradigm Shift for Decision Making Xiaoqian Liu Xingzhou Lou Jianbin Jiao Junge Zhang OffRL LLMAG 31 5 0 27 May 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 32 16 0 25 May 2024
Diffusion for World Modeling: Visual Details Matter in Atari Eloi Alonso Adam Jelley Vincent Micheli Anssi Kanervisto Amos Storkey Tim Pearce Franccois Fleuret 36 37 0 20 May 2024
RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes Kyle Stachowicz Sergey Levine 17 6 0 07 May 2024
Higher Replay Ratio Empowers Sample-Efficient Multi-Agent Reinforcement Learning Linjie Xu Zichuan Liu Alexander Dockhorn Diego Perez-Liebana Jinyu Wang Lei Song Jiang Bian 38 2 0 15 Apr 2024
Simple Ingredients for Offline Reinforcement Learning Edoardo Cetin Andrea Tirinzoni Matteo Pirotta A. Lazaric Yann Ollivier Ahmed Touati OffRL 24 2 0 19 Mar 2024
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence Marcel Hussing C. Voelcker Igor Gilitschenski Amir-massoud Farahmand Eric Eaton 29 3 0 09 Mar 2024
EfficientZero V2: Mastering Discrete and Continuous Control with Limited Data Shengjie Wang Shaohuai Liu Weirui Ye Jiacheng You Yang Gao OffRL 13 10 0 01 Mar 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 22 16 0 01 Mar 2024
In value-based deep reinforcement learning, a pruned network is a good network J. Obando-Ceron Aaron C. Courville Pablo Samuel Castro OffRL 33 18 0 19 Feb 2024
Mixtures of Experts Unlock Parameter Scaling for Deep RL J. Obando-Ceron Ghada Sokar Timon Willi Clare Lyle Jesse Farebrother Jakob N. Foerster Gintare Karolina Dziugaite Doina Precup Pablo Samuel Castro 39 27 0 13 Feb 2024
Q-Star Meets Scalable Posterior Sampling: Bridging Theory and Practice via HyperAgent Yingru Li Jiawei Xu Lei Han Zhi-Quan Luo BDL OffRL 12 6 0 05 Feb 2024
Self-supervised Pretraining for Decision Foundation Model: Formulation, Pipeline and Challenges Xiaoqian Liu Jianbin Jiao Junge Zhang OffRL LRM 31 2 0 29 Dec 2023
An Invitation to Deep Reinforcement Learning Bernhard Jaeger Andreas Geiger OffRL OOD 62 5 0 13 Dec 2023
Efficient Sparse-Reward Goal-Conditioned Reinforcement Learning with a High Replay Ratio and Regularization Takuya Hiraoka OffRL 22 1 0 10 Dec 2023
Handling Cost and Constraints with Off-Policy Deep Reinforcement Learning Jared Markowitz Jesse Silverberg Gary Collins OffRL 13 0 0 30 Nov 2023
Replay across Experiments: A Natural Extension of Off-Policy RL Dhruva Tirumala Thomas Lampe José Enrique Chen Tuomas Haarnoja Sandy Huang ... Tim Hertweck Leonard Hasenclever Martin Riedmiller N. Heess Markus Wulfmeier OffRL 18 8 0 27 Nov 2023
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization Guowei Xu Ruijie Zheng Yongyuan Liang Xiyao Wang Zhecheng Yuan ... Shuzhen Li Yanjie Ze Hal Daumé Furong Huang Huazhe Xu 26 26 0 30 Oct 2023