Better Instruction-Following Through Minimum Bayes Risk

Better Instruction-Following Through Minimum Bayes Risk

3 October 2024

Patrick Fernandes

Graham Neubig

Papers citing "Better Instruction-Following Through Minimum Bayes Risk"

7 / 7 papers shown

Title
A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond Xiaoye Qu Yafu Li Zhaochen Su Weigao Sun Jianhao Yan ... Chaochao Lu Yue Zhang Xian-Sheng Hua Bowen Zhou Yu Cheng ReLM OffRL LRM 76 11 0 27 Mar 2025
Scaling Evaluation-time Compute with Reasoning Models as Process Evaluators Seungone Kim Ian Wu Jinu Lee Xiang Yue Seongyun Lee ... Kiril Gashteovski Carolin (Haas) Lawrence J. Hockenmaier Graham Neubig Sean Welleck LRM 42 2 0 25 Mar 2025
Adding Chocolate to Mint: Mitigating Metric Interference in Machine Translation José P. Pombal Nuno M. Guerreiro Ricardo Rei André F. T. Martins 53 0 0 11 Mar 2025
Uncertainty-Aware Decoding with Minimum Bayes Risk Nico Daheim Clara Meister Thomas Möllenhoff Iryna Gurevych 48 0 0 07 Mar 2025
Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs Xingyu Chen Jiahao Xu Tian Liang Zhiwei He Jianhui Pang ... Z. Zhang Rui Wang Zhaopeng Tu Haitao Mi Dong Yu LRM ReLM 46 90 0 30 Dec 2024
MM-Eval: A Multilingual Meta-Evaluation Benchmark for LLM-as-a-Judge and Reward Models Guijin Son Dongkeun Yoon Juyoung Suk Javier Aula-Blasco Mano Aslan Vu Trong Kim Shayekh Bin Islam Jaume Prats-Cristià Lucía Tormo-Bañuelos Seungone Kim ELM LRM 25 8 0 23 Oct 2024
Direct Judgement Preference Optimization Peifeng Wang Austin Xu Yilun Zhou Caiming Xiong Shafiq Joty ELM 34 11 0 23 Sep 2024