Direct Judgement Preference Optimization

23 September 2024

Caiming Xiong

Shafiq Joty

Papers citing "Direct Judgement Preference Optimization"

2 / 2 papers shown

Title
Better Instruction-Following Through Minimum Bayes Risk Ian Wu Patrick Fernandes Amanda Bertsch Seungone Kim Sina Pakazad Graham Neubig 42 9 0 03 Oct 2024
HelpSteer2-Preference: Complementing Ratings with Preferences Zhilin Wang Alexander Bukharin Olivier Delalleau Daniel Egert Gerald Shen Jiaqi Zeng Oleksii Kuchaiev Yi Dong ALM 29 37 0 02 Oct 2024