Sample-Efficient Alignment for LLMs

3 November 2024

Papers citing "Sample-Efficient Alignment for LLMs"

1 / 1 papers shown

Title
SIMPLEMIX: Frustratingly Simple Mixing of Off- and On-policy Data in Language Model Preference Learning Tianjian Li Daniel Khashabi 53 0 0 05 May 2025