v1v2v3v4 (latest)

Balancing Training for Multilingual Neural Machine Translation

Annual Meeting of the Association for Computational Linguistics (ACL), 2020

14 April 2020

Xinyi Wang

Yulia Tsvetkov

Graham Neubig

ArXiv (abs)PDF HTML

Papers citing "Balancing Training for Multilingual Neural Machine Translation"

50 / 73 papers shown

Flexing in 73 Languages: A Single Small Model for Multilingual InflectionInternational Conference on Text, Speech and Dialogue (TSD), 2025

Tomáš Sourada

Jana Straková

148

27 Oct 2025

Using Temperature Sampling to Effectively Train Robot Learning Policies on Imbalanced Datasets

169

22 Oct 2025

DynamixSFT: Dynamic Mixture Optimization of Instruction Tuning Collections

178

16 Aug 2025

LLaVA-NeuMT: Selective Layer-Neuron Modulation for Efficient Multilingual Multimodal Translation

205

25 Jul 2025

HBO: Hierarchical Balancing Optimization for Fine-Tuning Large Language Models

616

18 May 2025

DRPruning: Efficient Large Language Model Pruning through Distributionally Robust OptimizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

652

21 Nov 2024

What is Wrong with Perplexity for Long-context Language Modeling?International Conference on Learning Representations (ICLR), 2024

807

31 Oct 2024

Optimizing the Training Schedule of Multilingual NMT using Reinforcement Learning

Alexis Allemann

Àlex R. Atrio

Andrei Popescu-Belis

392

08 Oct 2024

Upsample or Upweight? Balanced Training on Heavily Imbalanced DatasetsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2024

Tianjian Li

Haoran Xu

Weiting Tan

Kenton Murray

Daniel Khashabi

653

06 Oct 2024

Can the Variation of Model Weights be used as a Criterion for Self-Paced Multilingual NMT?

392

05 Oct 2024

NLIP_Lab-IITH Low-Resource MT System for WMT24 Indic MT Shared TaskConference on Machine Translation (WMT), 2024

Pramit Sahoo

Maharaj Brahma

Maunendra Sankar Desarkar

162

04 Oct 2024

Can Optimization Trajectories Explain Multi-Task Transfer?

David Mueller

Mark Dredze

Nicholas Andrews

509

26 Aug 2024

Low-Resource Machine Translation through the Lens of Personalized Federated LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

Chris Biemann

215

18 Jun 2024

Mixture-of-Skills: Learning to Optimize Data Usage for Fine-Tuning Large Language Models

239

13 Jun 2024

To Label or Not to Label: Hybrid Active Learning for Neural Machine TranslationInternational Conference on Computational Linguistics (COLING), 2024

262

14 Mar 2024

Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

...

Niklas Muennighoff

339

351

12 Feb 2024

Order Matters in the Presence of Dataset Imbalance for Multilingual Learning

Justin Gilmer

398

11 Dec 2023

Error Norm Truncation: Robust Training in the Presence of Data Noise for Text Generation ModelsInternational Conference on Learning Representations (ICLR), 2023

Daniel Khashabi

251

02 Oct 2023

Neural Machine Translation for the Indigenous Languages of the Americas: An Introduction

Graham Neubig

221

11 Jun 2023

Towards Higher Pareto Frontier in Multilingual Machine TranslationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

221

25 May 2023

LIMIT: Language Identification, Misidentification, and Translation using Hierarchical Models in 350+ LanguagesConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

M. Agarwal

Md Mahfuz Ibn Alam

Antonios Anastasopoulos

349

23 May 2023

A Pretrainer's Guide to Training Data: Measuring the Effects of Data Age, Domain Coverage, Quality, & ToxicityNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023

...

461

226

22 May 2023

RECKONING: Reasoning through Dynamic Knowledge EncodingNeural Information Processing Systems (NeurIPS), 2023

407

10 May 2023

Learning Language-Specific Layers for Multilingual Machine TranslationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

364

04 May 2023

UniMax: Fairer and more Effective Language Sampling for Large-Scale Multilingual PretrainingInternational Conference on Learning Representations (ICLR), 2023

Sharan Narang

336

127

18 Apr 2023

On the Pareto Front of Multilingual Neural Machine TranslationNeural Information Processing Systems (NeurIPS), 2023

408

06 Apr 2023

Towards Reliable Neural Machine Translation with Consistency-Aware Meta-LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

366

20 Mar 2023

Scaling Laws for Multilingual Neural Machine TranslationInternational Conference on Machine Learning (ICML), 2023

291

19 Feb 2023

Measuring The Impact Of Programming Language DistributionInternational Conference on Machine Learning (ICML), 2023

513

03 Feb 2023

Causes and Cures for Interference in Multilingual TranslationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

368

14 Dec 2022

Domain Curricula for Code-Switched MT at MixMT 2022Conference on Machine Translation (WMT), 2022

Lekan Raheem

Maab Elrashid

193

31 Oct 2022

Forging Multiple Training Objectives for Pre-trained Language Models via Meta-LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Fei Huang

Min Zhang

MoMe

318

19 Oct 2022

Tencent's Multilingual Machine Translation System for WMT22 Large-Scale African LanguagesConference on Machine Translation (WMT), 2022

300

18 Oct 2022

You Can Have Your Data and Balance It Too: Towards Balanced and Efficient Multilingual Models

Tomasz Limisiewicz

Daniel Malkin

Gabriel Stanovsky

219

13 Oct 2022

Language Tokens: A Frustratingly Simple Approach Improves Zero-Shot Performance of Multilingual TranslationConference of the Association for Machine Translation in the Americas (AMTA), 2022

Muhammad N. ElNokrashy

247

11 Aug 2022

Uni-Perceiver-MoE: Learning Sparse Generalist Models with Conditional MoEsNeural Information Processing Systems (NeurIPS), 2022

363

09 Jun 2022

Multilingual Neural Machine Translation with Deep Encoder and Multiple Shallow DecodersConference of the European Chapter of the Association for Computational Linguistics (EACL), 2022

Xiang Kong

Adithya Renduchintala

James Cross

Yuqing Tang

Jiatao Gu

Xian Li

236

05 Jun 2022

Unifying the Convergences in Multilingual Neural Machine TranslationConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

276

03 May 2022

Meta Learning for Natural Language Processing: A SurveyNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

Hung-yi Lee

Shang-Wen Li

Ngoc Thang Vu

450

03 May 2022

Por Qué Não Utiliser Alla Språk? Mixed Training with Gradient Optimization in Few-Shot Cross-Lingual Transfer

Haoran Xu

Kenton W. Murray

217

29 Apr 2022

PAEG: Phrase-level Adversarial Example Generation for Neural Machine TranslationInternational Conference on Computational Linguistics (COLING), 2022

Jian Yang

Yong Yu

Zhoujun Li

SILM AAML

329

06 Jan 2022

Multilingual Machine Translation Systems from Microsoft for WMT21 Shared TaskConference on Machine Translation (WMT), 2021

Jian Yang

...

Xia Song

167

03 Nov 2021

Tricks for Training Sparse Translation Models

Angela Fan

360

15 Oct 2021

Multilingual Neural Machine Translation:Can Linguistic Hierarchies Help?

220

15 Oct 2021

Bandits Don't Follow Rules: Balancing Multi-Facet Machine Translation with Multi-Armed Bandits

Julia Kreutzer

David Vilar

Artem Sokolov

267

13 Oct 2021

Sequential Reptile: Inter-Task Gradient Alignment for Multilingual Learning

446

06 Oct 2021

Improving Multilingual Translation by Representation and Gradient RegularizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

240

10 Sep 2021

Distributionally Robust Multilingual Machine TranslationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Chunting Zhou

Daniel Levy

Xian Li

Marjan Ghazvininejad

Graham Neubig

261

09 Sep 2021

Competence-based Curriculum Learning for Multilingual Machine TranslationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Mingliang Zhang

Fandong Meng

Y. Tong

Jie Zhou

251

09 Sep 2021

Uncertainty-Aware Balancing for Multilingual and Multi-Domain Neural Machine Translation TrainingConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Qun Liu

236

06 Sep 2021