Tactical Optimism and Pessimism for Deep Reinforcement Learning

Tactical Optimism and Pessimism for Deep Reinforcement Learning

7 February 2021

Theodore H. Moskovitz

Jack Parker-Holder

Michael I. Jordan

Papers citing "Tactical Optimism and Pessimism for Deep Reinforcement Learning"

15 / 15 papers shown

Title
Stabilizing Reinforcement Learning in Differentiable Multiphysics Simulation Eliot Xing Vernon Luk Jean Oh 84 0 0 16 Dec 2024
Dynamic Learning Rate for Deep Reinforcement Learning: A Bandit Approach Henrique Donâncio Antoine Barrier Leah F. South Florence Forbes 21 0 0 16 Oct 2024
MAD-TD: Model-Augmented Data stabilizes High Update Ratio RL C. Voelcker Marcel Hussing Eric Eaton Amir-massoud Farahmand Igor Gilitschenski 39 1 0 11 Oct 2024
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control Michal Nauman M. Ostaszewski Krzysztof Jankowski Piotr Milo's Marek Cygan OffRL 43 16 0 25 May 2024
Dissecting Deep RL with High Update Ratios: Combatting Value Divergence Marcel Hussing C. Voelcker Igor Gilitschenski Amir-massoud Farahmand Eric Eaton 34 3 0 09 Mar 2024
Overestimation, Overfitting, and Plasticity in Actor-Critic: the Bitter Lesson of Reinforcement Learning Michal Nauman Michal Bortkiewicz Piotr Milo's Tomasz Trzciñski M. Ostaszewski Marek Cygan OffRL 22 17 0 01 Mar 2024
On the Theory of Risk-Aware Agents: Bridging Actor-Critic and Economics Michal Nauman Marek Cygan 35 1 0 30 Oct 2023
Local Optimization Achieves Global Optimality in Multi-Agent Reinforcement Learning Yulai Zhao Zhuoran Yang Zhaoran Wang Jason D. Lee 35 3 0 08 May 2023
Wasserstein Actor-Critic: Directed Exploration via Optimism for Continuous-Actions Control Amarildo Likmeta Matteo Sacco Alberto Maria Metelli Marcello Restelli OffRL 16 3 0 04 Mar 2023
Efficient Online Reinforcement Learning with Offline Data Philip J. Ball Laura M. Smith Ilya Kostrikov Sergey Levine OffRL OnRL 18 163 0 06 Feb 2023
PAC-Bayesian Soft Actor-Critic Learning Bahareh Tasdighi Abdullah Akgul Manuel Haussmann Kenny Kazimirzak Brink M. Kandemir 34 3 0 30 Jan 2023
Design of experiments for the calibration of history-dependent models via deep reinforcement learning and an enhanced Kalman filter Ruben Villarreal Nikolaos N. Vlassis Nhon N. Phan Tommie A. Catanach Reese E. Jones N. Trask S. Kramer WaiChing Sun OffRL 30 11 0 27 Sep 2022
Stabilizing Off-Policy Deep Reinforcement Learning from Pixels Edoardo Cetin Philip J. Ball Steve Roberts Oya Celiktutan 30 36 0 03 Jul 2022
Multi-Agent Reinforcement Learning via Adaptive Kalman Temporal Difference and Successor Representation Mohammad Salimibeni Arash Mohammadi Parvin Malekzadeh Konstantinos N. Plataniotis 18 5 0 30 Dec 2021
Learning Pessimism for Robust and Efficient Off-Policy Reinforcement Learning Edoardo Cetin Oya Celiktutan OffRL 39 16 0 07 Oct 2021