v1v2v3 (latest)

Active Bayesian Assessment for Black-Box Classifiers

16 February 2020

Papers citing "Active Bayesian Assessment for Black-Box Classifiers"

10 / 10 papers shown

DISCO: Diversifying Sample Condensation for Efficient Model Evaluation

483

09 Oct 2025

Scaling Up Active Testing to Large Language Models

Gabrielle Berrada

Jannik Kossen

Muhammed Razzak

Freddie Bickford-Smith

Y. Gal

Tom Rainforth

ALM

212

12 Aug 2025

Lifelong Benchmarks: Efficient Model Evaluation in an Era of Rapid Progress

Christian Schroeder de Witt

271

29 Feb 2024

tinyBenchmarks: evaluating LLMs with fewer examples

482

201

22 Feb 2024

Label-Efficient Model Selection for Text Generation

439

12 Feb 2024

A structured regression approach for evaluating model performance across intersectional subgroupsConference on Fairness, Accountability and Transparency (FAccT), 2024

Christine Herlihy

Kimberly Truong

Alexandra Chouldechova

Miroslav Dudik

345

26 Jan 2024

Active Assessment of Prediction Services as Accuracy Surface Over Attribute CombinationsNeural Information Processing Systems (NeurIPS), 2021

Vihari Piratla

Soumen Chakrabarty

Sunita Sarawagi

231

14 Aug 2021

Counterfactual Explanations Can Be ManipulatedNeural Information Processing Systems (NeurIPS), 2021

Dylan Slack

Sophie Hilgard

Himabindu Lakkaraju

Sameer Singh

279

166

04 Jun 2021

Active Testing: Sample-Efficient Model EvaluationInternational Conference on Machine Learning (ICML), 2021

352

09 Mar 2021

Can I Trust My Fairness Metric? Assessing Fairness with Unlabeled Data and Bayesian InferenceNeural Information Processing Systems (NeurIPS), 2020

Disi Ji

Padhraic Smyth

M. Steyvers

234

19 Oct 2020