Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2505.22169
Cited By

ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments

v1v2 (latest)

ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments

28 May 2025

Gabriel Stanovsky

ArXiv (abs)PDF HTML Github (4046★)

Papers citing "ReliableEval: A Recipe for Stochastic LLM Evaluation via Method of Moments"

2 / 2 papers shown

PromptSuite: A Task-Agnostic Framework for Multi-Prompt Generation

PromptSuite: A Task-Agnostic Framework for Multi-Prompt Generation

Gabriel Stanovsky

352

1

0

20 Jul 2025

DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM Evaluation

DOVE: A Large-Scale Multi-Dimensional Predictions Dataset Towards Meaningful LLM EvaluationAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Michal Shmueli-Scheuer

Gabriel Stanovsky

360

12

0

03 Mar 2025

Page 1 of 1