Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2501.09080
Cited By

Average-Reward Soft Actor-Critic

v1v2 (latest)

Average-Reward Soft Actor-Critic

15 January 2025

Volodymyr Makarenko

ArXiv (abs)PDF HTML Github

Papers citing "Average-Reward Soft Actor-Critic"

1 / 1 papers shown

Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning

Entropy-guided sequence weighting for efficient exploration in RL-based LLM fine-tuning

Abdullah Vanlioglu

381

12

0

28 Mar 2025

Page 1 of 1