Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2506.03690
Cited By

Robust Preference Optimization via Dynamic Target Margins

v1v2 (latest)

Robust Preference Optimization via Dynamic Target Margins

Annual Meeting of the Association for Computational Linguistics (ACL), 2025

4 June 2025

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)Github (5★)

Papers citing "Robust Preference Optimization via Dynamic Target Margins"

3 / 3 papers shown

Failure Modes of Maximum Entropy RLHF

Failure Modes of Maximum Entropy RLHF

Ömer Veysel Çağatan

120

0

0

24 Sep 2025

LIMI: Less is More for Agency

LIMI: Less is More for Agency

...

215

5

0

22 Sep 2025

Dual Caption Preference Optimization for Diffusion Models

Dual Caption Preference Optimization for Diffusion Models

Agneet Chatterjee

Shamanthak Hegde

Bimsara Pathiraja

329

1

0

09 Feb 2025