v1v2v3 (latest)

XGLUE: A New Benchmark Dataset for Cross-lingual Pre-training, Understanding and Generation

Conference on Empirical Methods in Natural Language Processing (EMNLP), 2020

3 April 2020

Fan Yang

Daniel Fernando Campos

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "XGLUE: A New Benchmark Dataset for Cross-lingual Pre-training, Understanding and Generation"

50 / 222 papers shown

Operator-Theoretic Framework for Gradient-Free Federated Learning

Mohit Kumar

Mathias Brucker

Alexander Valentinitsch

279

30 Nov 2025

Cetvel: A Unified Benchmark for Evaluating Language Understanding, Generation and Cultural Capacity of LLMs for Turkish

230

22 Aug 2025

TASE: Token Awareness and Structured Evaluation for Multilingual Language Models

140

07 Aug 2025

Survey of NLU Benchmarks Diagnosing Linguistic Phenomena: Why not Standardize Diagnostics Benchmarks?

287

27 Jul 2025

A Culturally-Rich Romanian NLP Dataset from "Who Wants to Be a Millionaire?" Videos

Alexandru-Gabriel Ganea

Antonia-Adelina Popovici

Adrian-Marius Dumitran

249

06 Jun 2025

BnMMLU: Measuring Massive Multitask Language Understanding in Bengali

Saman Sarker Joy

Swakkhar Shatabda

ELM

231

25 May 2025

MAPS: A Multilingual Benchmark for Agent Performance and Security

Seraphina Goldfarb-Tarrant

Roman Vainshtein

300

21 May 2025

New Encoders for German Trained from Scratch: Comparing ModernGBERT with Converted LLM2Vec Models

364

19 May 2025

ReLI: A Language-Agnostic Approach to Human-Robot Interaction

718

03 May 2025

A Survey on Parameter-Efficient Fine-Tuning for Foundation Models in Federated Learning

421

29 Apr 2025

Command R7B Arabic: A Small, Enterprise Focused, Multilingual, and Culturally Aware Arabic LLM

...

353

18 Mar 2025

TLUE: A Tibetan Language Understanding Evaluation Benchmark

...

625

15 Mar 2025

LAG-MMLU: Benchmarking Frontier LLM Understanding in Latvian and Giriama

1.0K

14 Mar 2025

MMLU-ProX: A Multilingual Benchmark for Advanced Large Language Model Evaluation

...

Edison Marrese-Taylor

608

13 Mar 2025

EuroBERT: Scaling Multilingual Encoders for European Languages

Nicolas Boizard

Hippolyte Gisserot-Boukhlef

...

1.2K

07 Mar 2025

Where Are We? Evaluating LLM Performance on African LanguagesAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Ife Adebara

Hawau Olamide Toyin

Nahom Tesfu Ghebremichael

AbdelRahim Elmadany

Muhammad Abdul-Mageed

443

26 Feb 2025

NusaAksara: A Multimodal and Multilingual Benchmark for Preserving Indonesian Indigenous ScriptsAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Muhammad Farid Adilazuarda

409

25 Feb 2025

KazMMLU: Evaluating Language Models on Kazakh, Russian, and Regional Knowledge of KazakhstanAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

...

291

18 Feb 2025

IndicMMLU-Pro: Benchmarking Indic Large Language Models on Multi-Task Language Understanding

1.1K

27 Jan 2025

SailCompass: Towards Reproducible and Robust Evaluation for Southeast Asian Languages

347

02 Dec 2024

ChemTEB: Chemical Text Embedding Benchmark, an Overview of Embedding Models Performance & Efficiency on a Specific Domain

Ali Shiraee Kasmaee

Mohammad Khodadad

Mohammad Arshi Saloot

1.4K

30 Nov 2024

INCLUDE: Evaluating Multilingual Language Understanding with Regional KnowledgeInternational Conference on Learning Representations (ICLR), 2024

...

519

29 Nov 2024

USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness TaskInternational Workshop on Semantic Evaluation (SemEval), 2024

415

28 Nov 2024

LLäMmlein: Transparent, Compact and Competitive German-Only Language Models from ScratchAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Jan Pfister

Julia Wunderle

Andreas Hotho

620

17 Nov 2024

Delta: A Cloud-assisted Data Enrichment Framework for On-Device Continual LearningACM/IEEE International Conference on Mobile Computing and Networking (MobiCom), 2024

423

24 Oct 2024

VL-GLUE: A Suite of Fundamental yet Challenging Visuo-Linguistic Reasoning Tasks

Shailaja Keyur Sampat

Yezhou Yang

MLLM CoGe ReLM VLM LRM

244

17 Oct 2024

XTRUST: On the Multilingual Trustworthiness of Large Language Models

326

24 Sep 2024

AraDiCE: Benchmarks for Dialectal and Cultural Capabilities in LLMs

424

17 Sep 2024

SpeciaLex: A Benchmark for In-Context Specialized Lexicon Learning

Joseph Marvin Imperial

Harish Tayyar Madabushi

234

18 Jul 2024

Faux Polyglot: A Study on Information Disparity in Multilingual Large Language Models

Nikhil Sharma

Kenton Murray

Ziang Xiao

551

07 Jul 2024

Multilingual Trolley Problems for Language Models

Zhijing Jin

...

470

02 Jul 2024

PARIKSHA : A Large-Scale Investigation of Human-LLM Evaluator Agreement on Multilingual and Multi-Cultural Data

325

21 Jun 2024

On the Evaluation Practices in Multilingual NLP: Can Machine Translation Offer an Alternative to Human Translations?

458

20 Jun 2024

Prefix Text as a Yarn: Eliciting Non-English Alignment in Foundation Language Model

417

25 Apr 2024

Translation of Multifaceted Data without Re-Training of Machine Translation Systems

207

25 Apr 2024

TartuNLP @ SIGTYP 2024 Shared Task: Adapting XLM-RoBERTa for Ancient and Historical Languages

Aleksei Dorkin

Kairit Sirts

162

19 Apr 2024

From Form(s) to Meaning: Probing the Semantic Depths of Language Models Using Multisense Consistency

336

18 Apr 2024

PORTULAN ExtraGLUE Datasets and Models: Kick-starting a Benchmark for the Neural Processing of Portuguese

T. Osório

Bernardo Leite

Henrique Lopes Cardoso

Luís Gomes

João Rodrigues

Rodrigo Santos

António Branco

393

08 Apr 2024

Multilingual Large Language Model: A Survey of Resources, Taxonomy and Frontiers

Zhi Chen

Wanxiang Che

Philip S. Yu

LRM

401

07 Apr 2024

MaiNLP at SemEval-2024 Task 1: Analyzing Source Language Selection in Cross-Lingual Textual RelatednessInternational Workshop on Semantic Evaluation (SemEval), 2024

276

03 Apr 2024

Can Machine Translation Bridge Multilingual Pretraining and Cross-lingual Transfer Learning?

290

25 Mar 2024

VLUE: A New Benchmark and Multi-task Knowledge Transfer Learning for Vietnamese Natural Language Understanding

Phong Nguyen-Thuan Do

284

23 Mar 2024

DIALECTBENCH: A NLP Benchmark for Dialects, Varieties, and Closely-Related Languages

Antonios Anastasopoulos

260

16 Mar 2024

CLIcK: A Benchmark Dataset of Cultural and Linguistic Intelligence in KoreanInternational Conference on Language Resources and Evaluation (LREC), 2024

572

11 Mar 2024

Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMsConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

294

08 Mar 2024

A Measure for Transparent Comparison of Linguistic Diversity in Multilingual NLP Data Sets

Tanja Samardzic

Ximena Gutierrez-Vasques

Christian Bentz

Steven Moran

Olga Pelloni

282

06 Mar 2024

Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ

Paul Röttger

333

06 Mar 2024

Natural Language Processing Methods for Symbolic Music Generation and Information Retrieval: a Survey

261

27 Feb 2024

C^3

: Confidence Calibration Model Cascade for Inference-Efficient Cross-Lingual Natural Language Understanding

Jing Gao

191

25 Feb 2024

ArabicMMLU: Assessing Massive Multitask Language Understanding in Arabic

Abdelrahman Boda Sadallah

...

351

20 Feb 2024