v1v2v3 (latest)

mT5: A massively multilingual pre-trained text-to-text transformer

22 October 2020

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "mT5: A massively multilingual pre-trained text-to-text transformer"

50 / 1,562 papers shown

Hala Technical Report: Building Arabic-Centric Instruction & Translation Models at Scale

Hasan Hammoud

Mohammad Zbeeb

Bernard Ghanem

154

17 Sep 2025

DeDisCo at the DISRPT 2025 Shared Task: A System for Discourse Relation Classification

Zhuoxuan Ju

Jingni Wu

Abhishek Purushothama

Amir Zeldes

183

15 Sep 2025

SignMouth: Leveraging Mouthing Cues for Sign Language Translation by Multimodal Contrastive Fusion

328

12 Sep 2025

PolyTruth: Multilingual Disinformation Detection using Transformer-Based Language Models

Zaur Gouliev

Jennifer Waters

Chengqian Wang

12 Sep 2025

Building High-Quality Datasets for Portuguese LLMs: From Common Crawl Snapshots to Industrial-Grade Corpora

Thales Sales Almeida

Rodrigo Nogueira

Hélio Pedrini

157

10 Sep 2025

MultimodalHugs: Enabling Sign Language Processing in Hugging Face

223

10 Sep 2025

Building Large-Scale English-Romanian Literary Translation Resources with Open Models

153

09 Sep 2025

mmBERT: A Modern Multilingual Encoder with Annealed Language Learning

200

08 Sep 2025

Crosscoding Through Time: Tracking Emergence & Consolidation Of Linguistic Representations Throughout LLM Pretraining

Deniz Bayazit

Aaron Mueller

Antoine Bosselut

141

05 Sep 2025

Entropy2Vec: Crosslingual Language Modeling Entropy as End-to-End Learnable Language Representations

Patrick Amadeus Irawan

Ryandito Diandaru

Belati Jagad Bintang Syuhada

134

05 Sep 2025

OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search

...

232

03 Sep 2025

Zero-shot Cross-lingual NER via Mitigating Language Difference: An Entity-aligned Translation Perspective

121

01 Sep 2025

MixedG2P-T5: G2P-free Speech Synthesis for Mixed-script texts using Speech Self-Supervised Learning and Language Model

Joonyong Park

Daisuke Saito

Nobuaki Minematsu

01 Sep 2025

AdaptCache: KV Cache Native Storage Hierarchy for Low-Delay and High-Quality Language Model Serving

...

Ganesh Ananthanarayanan

Junchen Jiang

184

28 Aug 2025

Debiasing Multilingual LLMs in Cross-lingual Latent Space

148

25 Aug 2025

Speculating LLMs' Chinese Training Data Pollution from Their Tokens

25 Aug 2025

Evaluating the Impact of Verbal Multiword Expressions on Machine Translation

Linfeng Liu

Saptarshi Ghosh

Tianyu Jiang

24 Aug 2025

Quantifying Language Disparities in Multilingual Large Language Models

Songbo Hu

Ivan Vulić

Anna Korhonen

122

23 Aug 2025

OpenWHO: A Document-Level Parallel Corpus for Health Translation in Low-Resource Languages

287

22 Aug 2025

Long Chain-of-Thought Reasoning Across Languages

157

20 Aug 2025

In2x at WMT25 Translation Task

116

20 Aug 2025

When Alignment Hurts: Decoupling Representational Spaces in Multilingual Models

18 Aug 2025

Is GPT-OSS Good? A Comprehensive Evaluation of OpenAI's Latest Open Source Models

...

217

17 Aug 2025

Large Language Models for Summarizing Czech Historical Documents and BeyondInternational Conference on Agents and Artificial Intelligence (ICAART), 2025

130

14 Aug 2025

Evaluating LLMs on Chinese Idiom Translation

155

14 Aug 2025

Improving Generative Cross-lingual Aspect-Based Sentiment Analysis with Constrained Decoding

129

14 Aug 2025

Cross-Prompt Encoder for Low-Performing Languages

107

14 Aug 2025

Advancing Cross-lingual Aspect-Based Sentiment Analysis with LLMs and Constrained Decoding for Sequence-to-Sequence ModelsInternational Conference on Agents and Artificial Intelligence (ICAART), 2025

Jakub Šmíd

P. Pribán

Pavel Král

121

14 Aug 2025

LACA: Improving Cross-lingual Aspect-Based Sentiment Analysis with LLM Data AugmentationAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

Jakub Šmíd

P. Pribán

Pavel Král

13 Aug 2025

Cross-lingual Aspect-Based Sentiment Analysis: A Survey on Tasks, Approaches, and ChallengesInformation Fusion (Inf. Fusion), 2025

Jakub Šmíd

Pavel Král

137

13 Aug 2025

TopXGen: Topic-Diverse Parallel Data Generation for Low-Resource Machine Translation

A. Zebaze

Benoît Sagot

Rachel Bawden

104

12 Aug 2025

UWB at WASSA-2024 Shared Task 2: Cross-lingual Emotion DetectionWorkshop on Computational Approaches to Subjectivity, Sentiment and Social Media Analysis (WASSA), 2025

Jakub Šmíd

P. Pribán

Pavel Král

12 Aug 2025

Prompt-Based Approach for Czech Sentiment AnalysisRecent Advances in Natural Language Processing (RANLP), 2025

Jakub Šmíd

P. Pribán

115

12 Aug 2025

Utilizing Multilingual Encoders to Improve Large Language Models for Low-Resource LanguagesMoratuwa Engineering Research Conference (MERCon), 2025

Mokanarangan Thayaparan

219

12 Aug 2025

Czech Dataset for Complex Aspect-Based Sentiment Analysis TasksInternational Conference on Language Resources and Evaluation (LREC), 2025

156

11 Aug 2025

Few-shot Cross-lingual Aspect-Based Sentiment Analysis with Sequence-to-Sequence ModelsInternational Conference on Text, Speech and Dialogue (TSD), 2025

Jakub Šmíd

Pavel Přibáň

Pavel Král

124

11 Aug 2025

Multi-task Adversarial Attacks against Black-box Model with Few-shot QueriesAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

133

10 Aug 2025

Do Biased Models Have Biased Thoughts?

179

08 Aug 2025

H-Net++: Hierarchical Dynamic Chunking for Tokenizer-Free Language Modelling in Morphologically-Rich Languages

Mehrdad Zakershahrak

Samira Ghodratnama

VLM

07 Aug 2025

Semantic Bridge: Universal Multi-Hop Question Generation via AMR-Driven Graph Synthesis

120

06 Aug 2025

Parity-Aware Byte-Pair Encoding: Improving Cross-lingual Fairness in Tokenization

211

06 Aug 2025

Dynaword: From One-shot to Continuously Developed Datasets

Kenneth Enevoldsen

Kristian Nørgaard Jensen

...

172

04 Aug 2025

SHAMI-MT: A Syrian Arabic Dialect to Modern Standard Arabic Bidirectional Machine Translation System

04 Aug 2025

TIBSTC-CoT: A Multi-Domain Instruction Dataset for Chain-of-Thought Reasoning in Language Models

...

287

04 Aug 2025

The Art of Breaking Words: Rethinking Multilingual Tokenizer Design

Maunendra Sankar Desarkar

Ganesh Ramakrishnan

104

03 Aug 2025

Quantum-RAG and PunGPT2: Advancing Low-Resource Language Generation and Retrieval for the Punjabi Language

Jaskaranjeet Singh

Rakesh Thakur

176

03 Aug 2025

Multi-TW: Benchmarking Multimodal Models on Traditional Chinese Question Answering in Taiwan

02 Aug 2025

UrBLiMP: A Benchmark for Evaluating the Linguistic Competence of Large Language Models in Urdu

01 Aug 2025

Is neural semantic parsing good at ellipsis resolution, or isn't it?

Xiao Zhang

Johan Bos

229

31 Jul 2025

Beyond Gloss: A Hand-Centric Framework for Gloss-Free Sign Language Translation

Sobhan Asasi

Mohamed Ilyas Lakhal

Ozge Mercanoglu Sincan

Richard Bowden

SLR

202

31 Jul 2025