Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2503.23913
Cited By

Entropy-Based Adaptive Weighting for Self-Training

Entropy-Based Adaptive Weighting for Self-Training

31 March 2025

Mingyu Derek Ma

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)Github (19★)

Papers citing "Entropy-Based Adaptive Weighting for Self-Training"

5 / 5 papers shown

From Solving to Verifying: A Unified Objective for Robust Reasoning in LLMs

From Solving to Verifying: A Unified Objective for Robust Reasoning in LLMs

212

3

0

19 Nov 2025

On Memorization of Large Language Models in Logical Reasoning

On Memorization of Large Language Models in Logical Reasoning

Chulin Xie

Bill Yuchen Lin

Bo Li

545

104

0

30 Oct 2024

DPO Meets PPO: Reinforced Token Optimization for RLHF

DPO Meets PPO: Reinforced Token Optimization for RLHF

785

114

0

29 Apr 2024

Insights into Alignment: Evaluating DPO and its Variants Across Multiple Tasks

Insights into Alignment: Evaluating DPO and its Variants Across Multiple Tasks

Shivanshu Verma

Chitta Baral

505

40

0

23 Apr 2024

WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct

WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-InstructInternational Conference on Learning Representations (ICLR), 2023

...

980

678

0

18 Aug 2023

Page 1 of 1