v1v2 (latest)

Deep PQR: Solving Inverse Reinforcement Learning using Anchor Actions

15 July 2020

Papers citing "Deep PQR: Solving Inverse Reinforcement Learning using Anchor Actions"

1 / 1 papers shown

Title
Learning from an Exploring Demonstrator: Optimal Reward Estimation for Bandits Wenshuo Guo Kumar Krishna Agrawal Aditya Grover Vidya Muthukumar A. Pananjady 71 8 0 28 Jun 2021