POPO: Pessimistic Offline Policy Optimization

26 December 2020

Papers citing "POPO: Pessimistic Offline Policy Optimization"

2 / 2 papers shown

Title
Adaptive Policy Learning for Offline-to-Online Reinforcement Learning Han Zheng Xufang Luo Pengfei Wei Xuan Song Dongsheng Li Jing Jiang OffRL OnRL 8 21 0 14 Mar 2023
MEPG: A Minimalist Ensemble Policy Gradient Framework for Deep Reinforcement Learning Qiang He Yuxun Qu Chen Gong Xinwen Hou OffRL 14 10 0 22 Sep 2021