DNA: Proximal Policy Optimization with a Dual Network Architecture

20 June 2022

Papers citing "DNA: Proximal Policy Optimization with a Dual Network Architecture"

2 / 2 papers shown

Title
A Reinforcement Learning Method for Environments with Stochastic Variables: Post-Decision Proximal Policy Optimization with Dual Critic Networks L. Felizardo Edoardo Fadda Paolo Brandimarte E. Del-Moral-Hernandez Mariá Cristina Vasconcelos Nascimento OffRL 30 0 0 07 Apr 2025
Atari-5: Distilling the Arcade Learning Environment down to Five Games Matthew Aitchison Penny Sweetser Marcus Hutter 50 19 0 05 Oct 2022