Inference-Time Decontamination: Reusing Leaked Benchmarks for Large Language Model Evaluation

20 June 2024

Xipeng Qiu

Xuanjing Huang

Papers citing "Inference-Time Decontamination: Reusing Leaked Benchmarks for Large Language Model Evaluation"

3 / 3 papers shown

Title
Pushing the boundary on Natural Language Inference Pablo Miralles-González Javier Huertas-Tato Alejandro Martín David Camacho LRM 39 0 0 25 Apr 2025
Task Contamination: Language Models May Not Be Few-Shot Anymore Changmao Li Jeffrey Flanigan 92 87 0 26 Dec 2023
GLM-130B: An Open Bilingual Pre-trained Model Aohan Zeng Xiao Liu Zhengxiao Du Zihan Wang Hanyu Lai ... Jidong Zhai Wenguang Chen Peng-Zhen Zhang Yuxiao Dong Jie Tang BDL LRM 242 1,070 0 05 Oct 2022