Monte Carlo Augmented Actor-Critic for Sparse Reward Deep Reinforcement Learning from Suboptimal Demonstrations

14 October 2022

Papers citing "Monte Carlo Augmented Actor-Critic for Sparse Reward Deep Reinforcement Learning from Suboptimal Demonstrations"

4 / 4 papers shown

Title
Dense Dynamics-Aware Reward Synthesis: Integrating Prior Experience with Demonstrations Cevahir Köprülü Po-han Li Tianyu Qiu Ruihan Zhao T. Westenbroek David Fridovich-Keil Sandeep P. Chinchali Ufuk Topcu OffRL 92 0 0 02 Dec 2024
Enhancing Multi-Step Reasoning Abilities of Language Models through Direct Q-Function Optimization Guanlin Liu Kaixuan Ji Ning Dai Zheng Wu Chen Dun Q. Gu Lin Yan Quanquan Gu Lin Yan OffRL LRM 48 9 0 11 Oct 2024
Signal Temporal Logic-Guided Apprenticeship Learning Aniruddh Gopinath Puranic Jyotirmoy V. Deshmukh Stefanos Nikolaidis 40 1 0 09 Nov 2023
Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics Arsenii Kuznetsov Pavel Shvechikov Alexander Grishin Dmitry Vetrov 136 185 0 08 May 2020