Sample-Efficient Preference-based Reinforcement Learning with Dynamics Aware Rewards

28 February 2024

Miguel Sarabia

Papers citing "Sample-Efficient Preference-based Reinforcement Learning with Dynamics Aware Rewards"

2 / 2 papers shown

Title
Programming Refusal with Conditional Activation Steering Bruce W. Lee Inkit Padhi K. Ramamurthy Erik Miehling Pierre L. Dognin Manish Nagireddy Amit Dhurandhar LLMSV 91 13 0 06 Sep 2024
Leveraging Sub-Optimal Data for Human-in-the-Loop Reinforcement Learning Calarina Muslimani M. E. Taylor OffRL 38 2 0 30 Apr 2024