From "Thumbs Up" to "10 out of 10": Reconsidering Scalar Feedback in Interactive Reinforcement Learning

17 November 2023

Papers citing "From "Thumbs Up" to "10 out of 10": Reconsidering Scalar Feedback in Interactive Reinforcement Learning"

3 / 3 papers shown

Title
Enhancing Preference-based Linear Bandits via Human Response Time Shen Li Yuyang Zhang Zhaolin Ren Claire Liang Na Li J. Shah 34 0 0 03 Jan 2025
How Much Progress Did I Make? An Unexplored Human Feedback Signal for Teaching Robots Hang Yu Qidi Fang Shijie Fang Reuben M. Aronson E. Short 20 0 0 08 Jul 2024
Self-Initiated Open World Learning for Autonomous AI Agents Bing-Quan Liu Eric Robertson Scott Grigsby Sahisnu Mazumder AI4CE 30 8 0 21 Oct 2021