MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking

22 January 2025

Papers citing "MONA: Myopic Optimization with Non-myopic Approval Can Mitigate Multi-step Reward Hacking"

1 / 1 papers shown

Title
Higher-Order Belief in Incomplete Information MAIDs Jack Foxabbott Rohan Subramani Francis Rhys Ward 34 0 0 08 Mar 2025