Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2010.11934
Cited By

mT5: A massively multilingual pre-trained text-to-text transformer

v1v2v3 (latest)

mT5: A massively multilingual pre-trained text-to-text transformer

22 October 2020

Aditya Siddhant

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "mT5: A massively multilingual pre-trained text-to-text transformer"

50 / 1,563 papers shown

Beyond Specialization: Benchmarking LLMs for Transliteration of Indian Languages

Beyond Specialization: Benchmarking LLMs for Transliteration of Indian Languages

Mohammad Nadeem

160

0

0

26 May 2025

Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model

Mutarjim: Advancing Bidirectional Arabic-English Translation with a Small Language Model

Muhammad Hreden

Mohamed Motaism Hamed

Safwan AlModhayan

292

1

0

23 May 2025

Breaking mBad! Supervised Fine-tuning for Cross-Lingual Detoxification

Breaking mBad! Supervised Fine-tuning for Cross-Lingual Detoxification

Himanshu Beniwal

Thomas Hartvigsen

339

0

0

22 May 2025

Semantic Pivots Enable Cross-Lingual Transfer in Large Language Models

Semantic Pivots Enable Cross-Lingual Transfer in Large Language Models

248

0

0

22 May 2025

SELF: Self-Extend the Context Length With Logistic Growth Function

SELF: Self-Extend the Context Length With Logistic Growth Function

Phat Thanh Dang

Vipin Chaudhary

271

0

0

22 May 2025

Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities

Shared Path: Unraveling Memorization in Multilingual LLMs through Language Similarities

Johannes Bjerva

278

3

0

21 May 2025

LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization

LAGO: Few-shot Crosslingual Embedding Inversion Attacks via Language Similarity-Aware Graph Optimization

Johannes Bjerva

280

0

0

21 May 2025

JNLP at SemEval-2025 Task 11: Cross-Lingual Multi-Label Emotion Detection Using Generative Models

JNLP at SemEval-2025 Task 11: Cross-Lingual Multi-Label Emotion Detection Using Generative Models

Phuong Minh Nguyen

203

0

0

19 May 2025

Video-GPT via Next Clip Diffusion

Video-GPT via Next Clip Diffusion

Fangyikang Wang

625

5

0

18 May 2025

MergeBench: A Benchmark for Merging Domain-Specialized LLMs

MergeBench: A Benchmark for Merging Domain-Specialized LLMs

684

8

0

16 May 2025

Low-Resource Language Processing: An OCR-Driven Summarization and Translation Pipeline

Low-Resource Language Processing: An OCR-Driven Summarization and Translation Pipeline

Hrishit Madhavi

Dhananjay Bhagat

263

1

0

16 May 2025

Designing and Contextualising Probes for African Languages

Designing and Contextualising Probes for African Languages

372

0

0

15 May 2025

Aquarius: A Family of Industry-Level Video Generation Models for Marketing Scenarios

Aquarius: A Family of Industry-Level Video Generation Models for Marketing Scenarios

Jianzhong Liang

375

0

0

14 May 2025

Lost in Transliteration: Bridging the Script Gap in Neural IR

Lost in Transliteration: Bridging the Script Gap in Neural IRAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

224

2

0

13 May 2025

Scalable Multi-Stage Influence Function for Large Language Models via Eigenvalue-Corrected Kronecker-Factored Parameterization

Scalable Multi-Stage Influence Function for Large Language Models via Eigenvalue-Corrected Kronecker-Factored ParameterizationInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

385

0

0

08 May 2025

Overcoming Data Scarcity in Generative Language Modelling for Low-Resource Languages: A Systematic Review

Overcoming Data Scarcity in Generative Language Modelling for Low-Resource Languages: A Systematic Review

Nikola S. Nikolov

351

4

0

07 May 2025

Token-free Models for Sarcasm Detection

Token-free Models for Sarcasm Detection

Maitreya Sonawane

Maitreya Sonawane

Nishanth Sanjeev

250

0

0

02 May 2025

Investigating Task Arithmetic for Zero-Shot Information Retrieval

Investigating Task Arithmetic for Zero-Shot Information RetrievalAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2025

Alessandro Raganato

382

2

0

01 May 2025

Robust Misinformation Detection by Visiting Potential Commonsense Conflict

Robust Misinformation Detection by Visiting Potential Commonsense ConflictInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

Shengsheng Wang

242

2

0

30 Apr 2025

Improving Informally Romanized Language Identification

Improving Informally Romanized Language Identification

Alexander Gutkin

392

0

0

30 Apr 2025

A Generative-AI-Driven Claim Retrieval System Capable of Detecting and Retrieving Claims from Social Media Platforms in Multiple Languages

A Generative-AI-Driven Claim Retrieval System Capable of Detecting and Retrieving Claims from Social Media Platforms in Multiple Languages

384

1

0

29 Apr 2025

Enhancing Non-Core Language Instruction-Following in Speech LLMs via Semi-Implicit Cross-Lingual CoT Reasoning

Enhancing Non-Core Language Instruction-Following in Speech LLMs via Semi-Implicit Cross-Lingual CoT Reasoning

236

1

0

29 Apr 2025

RepText: Rendering Visual Text via Replicating

RepText: Rendering Visual Text via Replicating

314

2

0

28 Apr 2025

Low-Resource Neural Machine Translation Using Recurrent Neural Networks and Transfer Learning: A Case Study on English-to-Igbo

Low-Resource Neural Machine Translation Using Recurrent Neural Networks and Transfer Learning: A Case Study on English-to-Igbo

Ocheme Anthony Ekle

185

1

0

24 Apr 2025

Trillion 7B Technical Report

Trillion 7B Technical Report

877

4

0

21 Apr 2025

Kuwain 1.5B: An Arabic SLM via Language Injection

Kuwain 1.5B: An Arabic SLM via Language Injection

Mohamed Motaism Hamed

Safwan AlModhayan

284

3

0

21 Apr 2025

Remedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling

Remedy: Learning Machine Translation Evaluation from Human Preferences with Reward Modeling

300

1

0

18 Apr 2025

Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data

Learning from Reference Answers: Versatile Language Model Alignment without Binary Human Preference Data

456

4

0

14 Apr 2025

MorphTok: Morphologically Grounded Tokenization for Indian Languages

MorphTok: Morphologically Grounded Tokenization for Indian Languages

Ayush Maheshwari

Ganesh Ramakrishnan

Maunendra Sankar Desarkar

327

1

0

14 Apr 2025

Myanmar XNLI: Building a Dataset and Exploring Low-resource Approaches to Natural Language Inference with Myanmar

Myanmar XNLI: Building a Dataset and Exploring Low-resource Approaches to Natural Language Inference with MyanmarLanguage Resources and Evaluation (LRE), 2025

137

4

0

13 Apr 2025

Lugha-Llama: Adapting Large Language Models for African Languages

Lugha-Llama: Adapting Large Language Models for African Languages

Alexander Wettig

David Ifeoluwa Adelani

Christiane Fellbaum

271

6

0

09 Apr 2025

NNN: Next-Generation Neural Networks for Marketing Measurement

NNN: Next-Generation Neural Networks for Marketing Measurement

1.0K

0

0

08 Apr 2025

Llama-3-Nanda-10B-Chat: An Open Generative Large Language Model for Hindi

Llama-3-Nanda-10B-Chat: An Open Generative Large Language Model for Hindi

Monojit Choudhury

Rocktim Jyoti Das

...

Avraham Sheinin

Natalia Vassilieva

252

6

0

08 Apr 2025

Encoder-Decoder Gemma: Improving the Quality-Efficiency Trade-Off via Adaptation

Encoder-Decoder Gemma: Improving the Quality-Efficiency Trade-Off via Adaptation

Surya Bhupatiraju

198

12

0

08 Apr 2025

Regional Tiny Stories: Using Small Models to Compare Language Learning and Tokenizer Performance

Regional Tiny Stories: Using Small Models to Compare Language Learning and Tokenizer Performance

Malhar Abhay Inamdar

Guruprasad Pathak

Aryan Sagavekar

Raj Abhijit Dandekar

353

1

0

07 Apr 2025

On the Connection Between Diffusion Models and Molecular Dynamics

On the Connection Between Diffusion Models and Molecular Dynamics

Timothy T. Duignan

329

1

0

04 Apr 2025

$A$^\text{T}$A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting$

^\text{T}

A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background InpaintingComputer Vision and Pattern Recognition (CVPR), 2025

220

3

0

02 Apr 2025

Language Models at the Syntax-Semantics Interface: A Case Study of the Long-Distance Binding of Chinese Reflexive ziji

Language Models at the Syntax-Semantics Interface: A Case Study of the Long-Distance Binding of Chinese Reflexive zijiInternational Conference on Computational Linguistics (COLING), 2025

339

2

0

02 Apr 2025

VNJPTranslate: A comprehensive pipeline for Vietnamese-Japanese translation

VNJPTranslate: A comprehensive pipeline for Vietnamese-Japanese translation

Nguyen Duc Minh Vu

Nam Dang Phuong

223

0

0

01 Apr 2025

Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations

Catch Me if You Search: When Contextual Web Search Results Affect the Detection of HallucinationsComputers in Human Behavior (CHB), 2025

534

0

0

01 Apr 2025

The Challenge of Achieving Attributability in Multilingual Table-to-Text Generation with Question-Answer Blueprints

The Challenge of Achieving Attributability in Multilingual Table-to-Text Generation with Question-Answer BlueprintsInternational Journal of Undergraduate Research and Creative Activities (IJURCA), 2025

349

0

0

29 Mar 2025

Improving Low-Resource Retrieval Effectiveness using Zero-Shot Linguistic Similarity Transfer

Improving Low-Resource Retrieval Effectiveness using Zero-Shot Linguistic Similarity TransferEuropean Conference on Information Retrieval (ECIR), 2025

223

0

0

28 Mar 2025

Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation

Beyond Vanilla Fine-Tuning: Leveraging Multistage, Multilingual, and Domain-Specific Methods for Low-Resource Machine Translation

Sarubi Thillainathan

Sanath Jayasena

Surangika Ranathunga

279

1

0

28 Mar 2025

Low-resource Information Extraction with the European Clinical Case Corpus

Low-resource Information Extraction with the European Clinical Case Corpus

Pietro Ferrazzi

Giulia Mezzanotte

Manuela Speranza

Bernardo Magnini

240

1

0

26 Mar 2025

PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment

PAD: Towards Efficient Data Generation for Transfer Learning Using Phrase Alignment

Jong Myoung Kim

251

0

0

24 Mar 2025

LANGALIGN: Enhancing Non-English Language Models via Cross-Lingual Embedding Alignment

LANGALIGN: Enhancing Non-English Language Models via Cross-Lingual Embedding Alignment

Jong Myoung Kim

342

0

0

24 Mar 2025

PM4Bench: Benchmarking Large Vision-Language Models with Parallel Multilingual Multi-Modal Multi-task Corpus

PM4Bench: Benchmarking Large Vision-Language Models with Parallel Multilingual Multi-Modal Multi-task Corpus

...

351

5

0

24 Mar 2025

Language-specific Neurons Do Not Facilitate Cross-Lingual Transfer

Language-specific Neurons Do Not Facilitate Cross-Lingual Transfer

Soumen Kumar Mondal

Abhishek Singhania

281

8

0

21 Mar 2025

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

Fin-R1: A Large Language Model for Financial Reasoning through Reinforcement Learning

...

ReLM AIFin OffRL AI4TS LRM

359

50

0

20 Mar 2025

A Review on Large Language Models for Visual Analytics

A Review on Large Language Models for Visual Analytics

Navya Sonal Agarwal

Sanjay Kumar Sonbhadra

367

7

0

19 Mar 2025

1 2 3 4 5...30 31 32