Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2509.04784
Cited By

Post-training Large Language Models for Diverse High-Quality Responses

v1v2 (latest)

Post-training Large Language Models for Diverse High-Quality Responses

5 September 2025

Souradip Chakraborty

ArXiv (abs)PDF HTML

Papers citing "Post-training Large Language Models for Diverse High-Quality Responses"

2 / 2 papers shown

Representation-Based Exploration for Language Models: From Test-Time to Post-Training

Representation-Based Exploration for Language Models: From Test-Time to Post-Training

Dylan J. Foster

A. Krishnamurthy

140

1

0

13 Oct 2025

Random Policy Valuation is Enough for LLM Reasoning with Verifiable Rewards

Random Policy Valuation is Enough for LLM Reasoning with Verifiable Rewards

115

1

0

29 Sep 2025