v1v2v3 (latest)

The State and Fate of Linguistic Diversity and Inclusion in the NLP World

Annual Meeting of the Association for Computational Linguistics (ACL), 2020

20 April 2020

Papers citing "The State and Fate of Linguistic Diversity and Inclusion in the NLP World"

50 / 573 papers shown

M4-RAG: A Massive-Scale Multilingual Multi-Cultural Multimodal RAG

David Anugraha

Patrick Amadeus Irawan

196

05 Dec 2025

Adapting Large Language Models to Low-Resource Tibetan: A Two-Stage Continual and Supervised Fine-Tuning Study

188

03 Dec 2025

Modeling Topics and Sociolinguistic Variation in Code-Switched Discourse: Insights from Spanish-English and Spanish-Guaraní

Nemika Tyagi

Nelvin Licona-Guevara

Olga Kellert

03 Dec 2025

CACARA: Cross-Modal Alignment Leveraging a Text-Centric Approach for Cost-Effective Multimodal and Multilingual Learning

...

Simone Tiemi Hashiguti

116

29 Nov 2025

Named Entity Recognition for the Kurdish Sorani Language: Dataset Creation and Comparative Analysis

121

27 Nov 2025

AfriStereo: A Culturally Grounded Dataset for Evaluating Stereotypical Bias in Large Language Models

Yann Le Beux

Oluchi Audu

Oche D. Ankeli

Dhananjay Balakrishnan

Melissah Weya

Marie D. Ralaiarinosy

Ignatius Ezeani

165

27 Nov 2025

Donors and Recipients: On Asymmetric Transfer Across Tasks and Languages with Parameter-Efficient Fine-Tuning

191

17 Nov 2025

Rethinking what Matters: Effective and Robust Multilingual Realignment for Low-Resource Languages

220

09 Nov 2025

Who Gets Heard? Rethinking Fairness in AI for Music Systems

Kaustuv Kanti Ganguli

Nishanth Chandran

Zeerak Talat

Monojit Choudhury

131

08 Nov 2025

Evaluating Machine Translation Datasets for Low-Web Data Languages: A Gendered Lens

Hellina Hailu Nigatu

Bethelhem Yemane Mamo

Bontu Fufa Balcha

Debora Taye Tesfaye

Elbethel Daniel Zewdie

Ikram Behiru Nesiru

Jitu Ewnetu Hailu

Senait Mengesha Yayo

107

05 Nov 2025

EvalCards: A Framework for Standardized Evaluation Reporting

Ruchira Dhar

Danae Sanchez Villegas

...

101

05 Nov 2025

Safer in Translation? Presupposition Robustness in Indic Languages

128

03 Nov 2025

Why Do Multilingual Reasoning Gaps Emerge in Reasoning Language Models?

252

31 Oct 2025

Simple Additions, Substantial Gains: Expanding Scripts, Languages, and Lineage Coverage in URIEL+

185

31 Oct 2025

Between Myths and Metaphors: Rethinking LLMs for SRH in Conservative Contexts

Ameemah Humayun

Bushra Zubair

Maryam Mustafa

144

31 Oct 2025

Evaluating LLMs on Generating Age-Appropriate Child-Like Conversations

28 Oct 2025

Confabulations from ACL Publications (CAP): A Dataset for Scientific Hallucination Detection

Patanjali Bhamidipati

...

235

25 Oct 2025

Modality Matching Matters: Calibrating Language Distances for Cross-Lingual Transfer in URIEL+

207

22 Oct 2025

Identity-Aware Large Language Models require Cultural Reasoning

145

21 Oct 2025

ChiKhaPo: A Large-Scale Multilingual Benchmark for Evaluating Lexical Comprehension and Generation in Large Language Models

Emily Chang

Niyati Bafna

ELM

196

19 Oct 2025

MERLIN: A Testbed for Multilingual Multimodal Entity Recognition and Linking

Sathyanarayanan Ramamoorthy

166

16 Oct 2025

Document Intelligence in the Era of Large Language Models: A Survey

277

15 Oct 2025

Sparse Subnetwork Enhancement for Underrepresented Languages in Large Language Models

258

15 Oct 2025

Cost Analysis of Human-corrected Transcription for Predominately Oral Languages

Yacouba Diarra

Nouhoum Souleymane Coulibaly

Michael Leventhal

14 Oct 2025

Invisible Languages of the LLM Universe

Saurabh Khanna

Xinxu Li

110

13 Oct 2025

BabyBabelLM: A Multilingual Benchmark of Developmentally Plausible Training Data

...

184

11 Oct 2025

HUME: Measuring the Human-Model Performance Gap in Text Embedding Tasks

310

11 Oct 2025

SkipSR: Faster Super Resolution with Token Skipping

279

09 Oct 2025

Sunflower: A New Approach To Expanding Coverage of African Languages in Large Language Models

...

Nimpamya Janat Namara

Engineer Bainomugisha

Ernest Mwebaze

John Quinn

216

08 Oct 2025

Lemma Dilemma: On Lemma Generation Without Domain- or Language-Specific Training Data

Olia Toporkov

Alan Akbik

Rodrigo Agerri

183

08 Oct 2025

Pragyaan: Designing and Curating High-Quality Cultural Post-Training Datasets for Indian Languages

Neel Prabhanjan Rachamalla

185

08 Oct 2025

The African Languages Lab: A Collaborative Approach to Advancing Low-Resource African NLP

Sheriff Issaka

Keyi Wang

Yinka Ajibola

Oluwatumininu Samuel-Ipaye

...

Prisca Adwoa Dufie Yeboah

Saadia Gabriel

153

07 Oct 2025

mR3: Multilingual Rubric-Agnostic Reward Reasoning Models

539

01 Oct 2025

Multilingual Vision-Language Models, A Survey

Andrei-Alexandru Manea

Jindřich Libovický

VLM

215

26 Sep 2025

UPDESH: Synthesizing Grounded Instruction Tuning Data for 13 Indic Languages

333

25 Sep 2025

Low-Resource English-Tigrinya MT: Leveraging Multilingual Models, Custom Tokenizers, and Clean Evaluation Benchmarks

Hailay Teklehaymanot

Gebrearegawi Gidey

Wolfgang Nejdl

160

24 Sep 2025

Scaling, Simplification, and Adaptation: Lessons from Pretraining on Machine-Translated Text

Dan John Velasco

M. R

CLL LRM

153

22 Sep 2025

DIVERS-Bench: Evaluating Language Identification Across Domain Shifts and Code-Switching

Jessica Ojo

Zina Kamel

David Ifeoluwa Adelani

146

22 Sep 2025

Enhancing Cross-Lingual Transfer through Reversible Transliteration: A Huffman-Based Approach for Low-Resource Languages

Wenhao Zhuang

Yuan Sun

Xiaobing Zhao

151

22 Sep 2025

Cross-Attention is Half Explanation in Speech-to-Text Models

226

22 Sep 2025

Towards Open-Ended Discovery for Low-Resource NLP

Bonaventure F. P. Dossou

Henri Aïdasso

168

22 Sep 2025

TigerCoder: A Novel Suite of LLMs for Code Generation in Bangla

Nishat Raihan

Antonios Anastasopoulos

Marcos Zampieri

188

11 Sep 2025

COCO-Urdu: A Large-Scale Urdu Image-Caption Dataset with Multimodal Quality Estimation

Umair Hassan

125

10 Sep 2025

Advancing Conversational AI with Shona Slang: A Dataset and Hybrid Model for Digital Inclusion

Happymore Masoka

10 Sep 2025

Exploring Subjective Tasks in Farsi: A Survey Analysis and Evaluation of Language Models

Donya Rooein

Flor Miriam Plaza del Arco

Debora Nozza

Dirk Hovy

219

06 Sep 2025

No Text Needed: Forecasting MT Quality and Inequity from Fertility and Metadata

109

05 Sep 2025

Social Bias in Multilingual Language Models: A Survey

Lance Calvin Lim Gamboa

Yue Feng

Mark Lee

305

27 Aug 2025

It's All About In-Context Learning! Teaching Extremely Low-Resource Languages to LLMs

Yue Li

Zhixue Zhao

Carolina Scarton

187

26 Aug 2025

Quantifying Language Disparities in Multilingual Large Language Models

Songbo Hu

Ivan Vulić

Anna Korhonen

155

23 Aug 2025

Toward Responsible ASR for African American English Speakers: A Scoping Review of Bias and Equity in Speech Technology

133

20 Aug 2025