TyDi QA: A Benchmark for Information-Seeking Question Answering in Typologically Diverse Languages

Transactions of the Association for Computational Linguistics (TACL), 2020

10 March 2020

Papers citing "TyDi QA: A Benchmark for Information-Seeking Question Answering in Typologically Diverse Languages"

50 / 491 papers shown

M4-RAG: A Massive-Scale Multilingual Multi-Cultural Multimodal RAG

David Anugraha

Patrick Amadeus Irawan

196

05 Dec 2025

mmJEE-Eval: A Bilingual Multimodal Benchmark for Evaluating Scientific Reasoning in Vision-Language Models

Arka Mukherjee

Shreya Ghosh

LRM

200

12 Nov 2025

Rethinking what Matters: Effective and Robust Multilingual Realignment for Low-Resource Languages

220

09 Nov 2025

Mixtures of SubExperts for Large Language Continual Learning

Haeyong Kang

CLL KELM MoE

269

09 Nov 2025

Iterative Layer-wise Distillation for Efficient Compression of Large Language Models

Grigory Kovalev

M. Tikhomirov

151

07 Nov 2025

Do You Know About My Nation? Investigating Multilingual Language Models' Cultural Literacy Through Factual Knowledge

Eshaan Tanwar

Anwoy Chatterjee

Michael Stephen Saxon

Alon Albalak

William Wang

Tanmoy Chakraborty

169

01 Nov 2025

DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models

279

31 Oct 2025

Rethinking Cross-lingual Alignment: Balancing Transfer and Cultural Erasure in Multilingual LLMs

HyoJung Han

Sweta Agrawal

Eleftheria Briakou

140

29 Oct 2025

Can LLMs Write Faithfully? An Agent-Based Evaluation of LLM-generated Islamic Content

207

28 Oct 2025

Global PIQA: Evaluating Physical Commonsense Reasoning Across 100+ Languages and Cultures

T. Chang

Catherine Arnett

Abdelrahman Eldesokey

...

Gbenga Kayode Solomon

Gia Nghia Ngo

Gloria Udhehdhe-oze

LRM ELM

231

28 Oct 2025

Quality-Aware Translation Tagging in Multilingual RAG system

249

27 Oct 2025

LM-mixup: Text Data Augmentation via Language Model based Mixup

145

23 Oct 2025

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

178

21 Oct 2025

ChiKhaPo: A Large-Scale Multilingual Benchmark for Evaluating Lexical Comprehension and Generation in Large Language Models

Emily Chang

Niyati Bafna

ELM

196

19 Oct 2025

Evaluating Arabic Large Language Models: A Survey of Benchmarks, Methods, and Gaps

Ahmed Alzubaidi

Shaikha Alsuwaidi

Basma El Amel Boussaha

216

15 Oct 2025

Bolster Hallucination Detection via Prompt-Guided Data Augmentation

226

13 Oct 2025

Type and Complexity Signals in Multilingual Question Representations

Robin Kokot

Wessel Poelman

137

07 Oct 2025

CDT: A Comprehensive Capability Framework for Large Language Models Across Cognition, Domain, and Task

165

29 Sep 2025

Anecdoctoring: Automated Red-Teaming Across Language and Place

Madeleine I. G. Daepp

160

23 Sep 2025

DRISHTIKON: A Multimodal Multilingual Benchmark for Testing Language Models' Understanding on Indian Culture

258

23 Sep 2025

Uncertainty in Semantic Language Modeling with PIXELS

Stefania Radu

Marco Zullich

Matias Valdenegro-Toro

201

23 Sep 2025

Breaking Token Into Concepts: Exploring Extreme Compression in Token Representation Via Compositional Shared Semantics

Kavin R V

Pawan Goyal

111

22 Sep 2025

Probabilistic Token Alignment for Large Language Model Fusion

...

209

21 Sep 2025

HARP: Hallucination Detection via Reasoning Subspace Projection

265

15 Sep 2025

MultiWikiQA: A Reading Comprehension Benchmark in 300+ Languages

Dan Saattrup Smart

RALM

442

04 Sep 2025

AraHalluEval: A Fine-grained Hallucination Evaluation Framework for Arabic LLMs

Aisha Alansari

Hamzah Luqman

HILM LRM

273

04 Sep 2025

Implicit Reasoning in Large Language Models: A Comprehensive Survey

285

02 Sep 2025

The Gold Medals in an Empty Room: Diagnosing Metalinguistic Reasoning in LLMs with Camlang

249

30 Aug 2025

CultranAI at PalmX 2025: Data Augmentation for Cultural Knowledge Representation

Hunzalah Hassan Bhatti

Youssef Ahmed

Md. Arid Hasan

Firoj Alam

270

24 Aug 2025

Quantifying Language Disparities in Multilingual Large Language Models

Songbo Hu

Ivan Vulić

Anna Korhonen

155

23 Aug 2025

M3TQA: Massively Multilingual Multitask Table Question Answering

...

235

22 Aug 2025

XLQA: A Benchmark for Locale-Aware Multilingual Open-Domain Question Answering

224

22 Aug 2025

SEA-BED: How Do Embedding Models Represent Southeast Asian Languages?

Wuttikorn Ponwitayarat

...

Ekapol Chuangsuwanich

Sarana Nutanong

Peerat Limkonchotiwat

FedML

229

17 Aug 2025

LoraxBench: A Multitask, Multilingual Benchmark Suite for 20 Indonesian Languages

Alham Fikri Aji

Trevor Cohn

159

17 Aug 2025

Two-Stage Quranic QA via Ensemble Retrieval and Instruction-Tuned Answer Extraction

274

09 Aug 2025

TASE: Token Awareness and Structured Evaluation for Multilingual Language Models

144

07 Aug 2025

Forgetting: A New Mechanism Towards Better Large Language Model Fine-tuning

Ali Taheri Ghahrizjani

396

06 Aug 2025

MegaWika 2: A More Comprehensive Multilingual Collection of Articles and their Sources

334

05 Aug 2025

HeQ: a Large and Diverse Hebrew Reading Comprehension BenchmarkConference on Empirical Methods in Natural Language Processing (EMNLP), 2025

167

03 Aug 2025

Enhanced Arabic Text Retrieval with Attentive Relevance Scoring

Salah Eddine Bekhouche

260

31 Jul 2025

CUS-QA: Local-Knowledge-Oriented Open-Ended Question Answering Dataset

Jindrich Libovický

Jindřich Helcl

Andrei-Alexandru Manea

Gianluca Vico

296

30 Jul 2025

HW-MLVQA: Elucidating Multilingual Handwritten Document Understanding with a Comprehensive VQA Benchmark

135

21 Jul 2025

BlockFFN: Towards End-Side Acceleration-Friendly Mixture-of-Experts with Chunk-Level Activation Sparsity

340

11 Jul 2025

SANSKRITI: A Comprehensive Benchmark for Evaluating Language Models' Knowledge of Indian CultureAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

381

18 Jun 2025

ClusterUCB: Efficient Gradient-Based Data Selection for Targeted Fine-Tuning of LLMs

291

12 Jun 2025

Shaking to Reveal: Perturbation-Based Detection of LLM Hallucinations

299

03 Jun 2025

Data Pruning by Information MaximizationInternational Conference on Learning Representations (ICLR), 2025

374

02 Jun 2025

Charting the Landscape of African NLP: Mapping Progress and Shaping the Road Ahead

Jesujoba Oluwadara Alabi

Michael A. Hedderich

David Ifeoluwa Adelani

Dietrich Klakow

563

27 May 2025

Efficient Data Selection at Scale via Influence Distillation

447

25 May 2025

ProDS: Preference-oriented Data Selection for Instruction Tuning

330

19 May 2025