Magnetic Preference Optimization: Achieving Last-iterate Convergence for Language Model Alignment

22 October 2024

Papers citing "Magnetic Preference Optimization: Achieving Last-iterate Convergence for Language Model Alignment"

1 / 1 papers shown

Title
Restoring Calibration for Aligned Large Language Models: A Calibration-Aware Fine-Tuning Approach Jiancong Xiao Bojian Hou Zhanliang Wang Ruochen Jin Q. Long Weijie Su Li Shen 26 0 0 04 May 2025