Model-based Policy Optimization using Symbolic World Model

18 July 2024

Papers citing "Model-based Policy Optimization using Symbolic World Model"

2 / 2 papers shown

Title
Reset-Free Reinforcement Learning via Multi-Task Learning: Learning Dexterous Manipulation Behaviors without Human Intervention Abhishek Gupta Justin Yu Tony Zhao Vikash Kumar Aaron Rovinsky Kelvin Xu Thomas Devlin Sergey Levine OffRL 69 94 0 22 Apr 2021
Fine-Tuning Language Models from Human Preferences Daniel M. Ziegler Nisan Stiennon Jeff Wu Tom B. Brown Alec Radford Dario Amodei Paul Christiano G. Irving ALM 280 1,587 0 18 Sep 2019