Optimizing Safe and Aligned Language Generation: A Multi-Objective GRPO Approach

26 March 2025

Papers citing "Optimizing Safe and Aligned Language Generation: A Multi-Objective GRPO Approach"

1 / 1 papers shown

Title
FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning Xupeng Miao Gabriele Oliaro Xinhao Cheng Vineeth Kada Ruohan Gao ... April Yang Yingcheng Wang Mengdi Wu Colin Unger Zhihao Jia MoE 85 8 0 29 Feb 2024