Taming Overconfidence in LLMs: Reward Calibration in RLHF

Taming Overconfidence in LLMs: Reward Calibration in RLHF

13 October 2024

Chengsong Huang

Papers citing "Taming Overconfidence in LLMs: Reward Calibration in RLHF"

Title
No papers