v1v2 (latest)

Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost

3 June 2024

Papers citing "Luna: An Evaluation Foundation Model to Catch Language Model Hallucinations with High Accuracy and Low Cost"

2 / 2 papers shown

Title
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation Gaurav Sahu Abhay Puri Juan A. Rodriguez Alexandre Drouin Perouz Taslakian ... Christopher Pal Nicolas Chapados I. Laradji Sai Rajeswar Mudumba Issam Hadj Laradji ELM 202 8 0 08 Jul 2024
Ragas: Automated Evaluation of Retrieval Augmented Generation ES Shahul Jithin James Luis Espinosa-Anke Steven Schockaert 256 268 0 26 Sep 2023