mmT5: Modular Multilingual Pre-Training Solves Source Language
Hallucinations

mmT5: Modular Multilingual Pre-Training Solves Source Language Hallucinations

23 May 2023

Francesco Piccinno

Massimo Nicosia

Xinyi Wang

Sebastian Ruder

Papers citing "mmT5: Modular Multilingual Pre-Training Solves Source Language Hallucinations"

5 / 5 papers shown

Title
Large Language Models are Easily Confused: A Quantitative Metric, Security Implications and Typological Analysis Yiyi Chen Qiongxiu Li Russa Biswas Johannes Bjerva 34 1 0 17 Oct 2024
Understanding and Mitigating Language Confusion in LLMs Kelly Marchisio Wei-Yin Ko Alexandre Berard Théo Dehaze Sebastian Ruder 49 23 0 28 Jun 2024
Tricks for Training Sparse Translation Models Dheeru Dua Shruti Bhosale Vedanuj Goswami James Cross M. Lewis Angela Fan MoE 139 19 0 15 Oct 2021
Beyond Distillation: Task-level Mixture-of-Experts for Efficient Inference Sneha Kudugunta Yanping Huang Ankur Bapna M. Krikun Dmitry Lepikhin Minh-Thang Luong Orhan Firat MoE 119 104 0 24 Sep 2021
Orthogonal Language and Task Adapters in Zero-Shot Cross-Lingual Transfer M. Vidoni Ivan Vulić Goran Glavas 29 27 0 11 Dec 2020