v1v2 (latest)

BnMMLU: Measuring Massive Multitask Language Understanding in Bengali

25 May 2025

Saman Sarker Joy

Swakkhar Shatabda

ELM

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)Github (28717★)

Papers citing "BnMMLU: Measuring Massive Multitask Language Understanding in Bengali"

6 / 6 papers shown

CRaFT: An Explanation-Based Framework for Evaluating Cultural Reasoning in Multilingual Language Models

Shehenaz Hossain

Haithem Afli

ELM LRM

107

15 Oct 2025

M3KE: A Massive Multi-Level Multi-Subject Knowledge Evaluation Benchmark for Chinese Large Language Models

...

Qun Liu

270

17 May 2023

Language Model Tokenizers Introduce Unfairness Between LanguagesNeural Information Processing Systems (NeurIPS), 2023

345

169

17 May 2023

ChatGPT Beyond English: Towards a Comprehensive Evaluation of Large Language Models in Multilingual LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Viet Dac Lai

Nghia Trung Ngo

Amir Pouran Ben Veyseh

239

356

12 Apr 2023

Measuring Massive Multitask Language UnderstandingInternational Conference on Learning Representations (ICLR), 2020

2.3K

6,566

07 Sep 2020

XGLUE: A New Benchmark Dataset for Cross-lingual Pre-training, Understanding and GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2020

...

Fan Yang

Daniel Fernando Campos

Rangan Majumder

Ming Zhou

ELM VLM

310

370

03 Apr 2020