COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically
for Model-Based RL

COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically for Model-Based RL

11 October 2023

Wichayaporn Wongkamjan

Furong Huang

Papers citing "COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically for Model-Based RL"

7 / 7 papers shown

Title
Look Before Leap: Look-Ahead Planning with Uncertainty in Reinforcement Learning Yongshuai Liu Xin Liu 85 1 0 26 Mar 2025
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning Y. Liu Kevin Qinghong Lin C. Chen Mike Zheng Shou LM&Ro LRM 62 0 0 17 Mar 2025
World Models with Hints of Large Language Models for Goal Achieving Zeyuan Liu Ziyu Huan Xiyao Wang Jiafei Lyu Jian Tao Xiu Li Furong Huang Huazhe Xu LM&Ro LRM AI4CE 23 1 0 11 Jun 2024
Mementos: A Comprehensive Benchmark for Multimodal Large Language Model Reasoning over Image Sequences Xiyao Wang Yuhang Zhou Xiaoyu Liu Hongjin Lu Yuancheng Xu ... Taixi Lu Gedas Bertasius Mohit Bansal Huaxiu Yao Furong Huang LRM VLM 70 65 0 19 Jan 2024
Planning Goals for Exploration E. Hu Richard Chang Oleh Rybkin Dinesh Jayaraman 27 23 0 23 Mar 2023
Mismatched No More: Joint Model-Policy Optimization for Model-Based RL Benjamin Eysenbach Alexander Khazatsky Sergey Levine Ruslan Salakhutdinov OffRL 179 43 0 06 Oct 2021
Model-based Policy Optimization with Unsupervised Model Adaptation Jian Shen Han Zhao Weinan Zhang Yong Yu 27 25 0 19 Oct 2020