Non-Markovian Reward Modelling from Trajectory Labels via Interpretable Multiple Instance Learning

30 May 2022

Sarvapali Ramchurn

Papers citing "Non-Markovian Reward Modelling from Trajectory Labels via Interpretable Multiple Instance Learning"

1 / 1 papers shown

Title
Preference Transformer: Modeling Human Preferences using Transformers for RL Changyeon Kim Jongjin Park Jinwoo Shin Honglak Lee Pieter Abbeel Kimin Lee OffRL 30 61 0 02 Mar 2023