mGPT: Few-Shot Learners Go Multilingual

15 April 2022

Alena Fenogenova

Papers citing "mGPT: Few-Shot Learners Go Multilingual"

50 / 110 papers shown

Title
Do Llamas Work in English? On the Latent Language of Multilingual Transformers Chris Wendler V. Veselovsky Giovanni Monea Robert West 56 95 0 16 Feb 2024
Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model A. Ustun Viraat Aryabumi Zheng-Xin Yong Wei-Yin Ko Daniel D'souza ... Shayne Longpre Niklas Muennighoff Marzieh Fadaee Julia Kreutzer Sara Hooker ALM ELM SyDa LRM 27 193 0 12 Feb 2024
Text Detoxification as Style Transfer in English and Hindi Sourabrata Mukherjee Akanksha Bansal Atul Kr. Ojha John P. Mccrae Ondrej Dusek 19 8 0 12 Feb 2024
From Partial to Strictly Incremental Constituent Parsing Ana Ezquerro Carlos Gómez-Rodríguez David Vilares 6 0 0 05 Feb 2024
CroissantLLM: A Truly Bilingual French-English Language Model Manuel Faysse Patrick Fernandes Nuno M. Guerreiro António Loison Duarte M. Alves ... François Yvon André F.T. Martins Gautier Viaud C´eline Hudelot Pierre Colombo 43 33 0 01 Feb 2024
TeenyTinyLlama: open-source tiny language models trained in Brazilian Portuguese N. Corrêa Sophia Falk Shiza Fatimah Aniket Sen N. D. Oliveira 20 9 0 30 Jan 2024
ToPro: Token-Level Prompt Decomposition for Cross-Lingual Sequence Labeling Tasks Bolei Ma Ercong Nie Shuzhou Yuan Helmut Schmid Michael Farber Frauke Kreuter Hinrich Schütze VLM 95 5 0 29 Jan 2024
TURNA: A Turkish Encoder-Decoder Language Model for Enhanced Understanding and Generation Gokcce Uludougan Zeynep Yirmibecsouglu Balal Furkan Akkurt Melikcsah Turker Onur Gungor S. Uskudarli 25 12 0 25 Jan 2024
MaLA-500: Massive Language Adaptation of Large Language Models Peiqin Lin Shaoxiong Ji Jörg Tiedemann André F. T. Martins Hinrich Schütze ELM 23 15 0 24 Jan 2024
Milestones in Bengali Sentiment Analysis leveraging Transformer-models: Fundamentals, Challenges and Future Directions Saptarshi Sengupta Shreya Ghosh Prasenjit Mitra Tarikul Islam Tamiti 33 0 0 15 Jan 2024
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages Zhuoyuan Mao Yen Yu ALM 15 2 0 11 Jan 2024
MERA: A Comprehensive LLM Evaluation in Russian Alena Fenogenova Artem Chervyakov Nikita Martynov Anastasia Kozlova Maria Tikhonova ... Nikita Savushkin Polina Mikhailova Denis Dimitrov Alexander Panchenko Sergey Markov ELM 28 10 0 09 Jan 2024
PersianLLaMA: Towards Building First Persian Large Language Model Mohammad Amin Abbasi A. Ghafouri Mahdi Firouzmandi Hassan Naderi B. Minaei-Bidgoli 13 9 0 25 Dec 2023
Predicting Human Translation Difficulty with Neural Machine Translation Zheng Wei Lim Ekaterina Vylomova Charles Kemp Trevor Cohn 22 0 0 19 Dec 2023
OFA: A Framework of Initializing Unseen Subword Embeddings for Efficient Large-scale Multilingual Continued Pretraining Yihong Liu Peiqin Lin Mingyang Wang Hinrich Schütze 19 21 0 15 Nov 2023
Multilingual Nonce Dependency Treebanks: Understanding how Language Models represent and process syntactic structure David Arps Laura Kallmeyer Younes Samih Hassan Sajjad 19 1 0 13 Nov 2023
Efficiently Adapting Pretrained Language Models To New Languages Zoltan Csaki Pian Pawakapan Urmish Thakker Qiantong Xu CLL 21 17 0 09 Nov 2023
Vicinal Risk Minimization for Few-Shot Cross-lingual Transfer in Abusive Language Detection Gretel Liz De la Pena Sarracén Paolo Rosso Robert Litschko Goran Glavas Simone Paolo Ponzetto 16 1 0 03 Nov 2023
Do large language models solve verbal analogies like children do? Claire E. Stevenson Mathilde ter Veen Rochelle Choenni Han L. J. van der Maas Ekaterina Shutova LRM 11 8 0 31 Oct 2023
Domain Terminology Integration into Machine Translation: Leveraging Large Language Models Yasmin Moslem Gianfranco Romani Mahdi Molaei Rejwanul Haque John D. Kelleher Andy Way 29 16 0 22 Oct 2023
On Bilingual Lexicon Induction with Large Language Models Yaoyiran Li Anna Korhonen Ivan Vulić 26 3 0 21 Oct 2023
Tokenizer Choice For LLM Training: Negligible or Crucial? Mehdi Ali Michael Fromm Klaudia Thellmann Richard Rutmann Max Lübbering ... Malte Ostendorff Samuel Weinbach R. Sifa Stefan Kesselheim Nicolas Flores-Herr 21 47 0 12 Oct 2023
Exploring the Maze of Multilingual Modeling Sina Bagheri Nezhad Ameeta Agrawal 16 1 0 09 Oct 2023
Fast-DetectGPT: Efficient Zero-Shot Detection of Machine-Generated Text via Conditional Probability Curvature Guangsheng Bao Yanbin Zhao Zhiyang Teng Linyi Yang Yue Zhang 13 129 0 08 Oct 2023
GECTurk: Grammatical Error Correction and Detection Dataset for Turkish Atakan Kara Farrin Marouf Sofian Andrew Bond Gözde Gül Sahin 16 4 0 20 Sep 2023
A Family of Pretrained Transformer Language Models for Russian Dmitry Zmitrovich Alexander Abramov Andrey Kalmykov Maria Tikhonova Ekaterina Taktasheva ... Vitalii Kadulin Sergey Markov Tatiana Shavrina Vladislav Mikhailov Alena Fenogenova 20 26 0 19 Sep 2023
Multilingual Text Representation Fahim Faisal 16 0 0 02 Sep 2023
Journey to the Center of the Knowledge Neurons: Discoveries of Language-Independent Knowledge Neurons and Degenerate Knowledge Neurons Yuheng Chen Pengfei Cao Yubo Chen Kang Liu Jun Zhao KELM 25 41 0 25 Aug 2023
Testing the Predictions of Surprisal Theory in 11 Languages Ethan Gotlieb Wilcox Tiago Pimentel Clara Meister Ryan Cotterell R. Levy LRM 36 63 0 07 Jul 2023
Language Versatilists vs. Specialists: An Empirical Revisiting on Multilingual Transfer Ability Jiacheng Ye Xijia Tao Lingpeng Kong LRM 28 22 0 11 Jun 2023
ModuleFormer: Modularity Emerges from Mixture-of-Experts Yikang Shen Zheyu Zhang Tianyou Cao Shawn Tan Zhenfang Chen Chuang Gan KELM MoE 25 6 0 07 Jun 2023
bgGLUE: A Bulgarian General Language Understanding Evaluation Benchmark Momchil Hardalov Pepa Atanasova Todor Mihaylov G. Angelova K. Simov P. Osenova Ves Stoyanov Ivan Koychev Preslav Nakov Dragomir R. Radev ELM FedML 21 4 0 04 Jun 2023
Having Beer after Prayer? Measuring Cultural Bias in Large Language Models Tarek Naous Michael Joseph Ryan Alan Ritter Wei-ping Xu 24 84 0 23 May 2023
mPLM-Sim: Better Cross-Lingual Similarity and Transfer in Multilingual Pretrained Language Models Peiqin Lin Chengzhi Hu Zheyu Zhang André F. T. Martins Hinrich Schütze 22 1 0 23 May 2023
Language Models for German Text Simplification: Overcoming Parallel Data Scarcity through Style-specific Pre-training Miriam Anschütz Joshua Oehms Thomas Wimmer Bartlomiej Jezierski Georg Groh 19 21 0 22 May 2023
Kanbun-LM: Reading and Translating Classical Chinese in Japanese Methods by Language Models Hao Wang Hirofumi Shimizu Daisuke Kawahara 21 1 0 22 May 2023
Efficient Language Model Training through Cross-Lingual and Progressive Transfer Learning Malte Ostendorff Georg Rehm CLIP VLM CLL 30 22 0 23 Jan 2023
JASMINE: Arabic GPT Models for Few-Shot Learning El Moatez Billah Nagoudi Muhammad Abdul-Mageed AbdelRahim Elmadany Alcides Alcoba Inciarte Md. Tawkat Islam Khondaker 11 7 0 21 Dec 2022
Geographic and Geopolitical Biases of Language Models Fahim Faisal Antonios Anastasopoulos 11 19 0 20 Dec 2022
Cross-Lingual Retrieval Augmented Prompt for Low-Resource Languages Ercong Nie Sheng Liang Helmut Schmid Hinrich Schütze VLM RALM LRM 20 22 0 19 Dec 2022
BLOOM+1: Adding Language Support to BLOOM for Zero-Shot Prompting Zheng-Xin Yong Hailey Schoelkopf Niklas Muennighoff Alham Fikri Aji David Ifeoluwa Adelani ... Genta Indra Winata Stella Biderman Edward Raff Dragomir R. Radev Vassilina Nikoulina CLL VLM AI4CE LRM 27 81 0 19 Dec 2022
In-context Examples Selection for Machine Translation Sweta Agrawal Chunting Zhou M. Lewis Luke Zettlemoyer Marjan Ghazvininejad LRM 20 185 0 05 Dec 2022
Legal Prompt Engineering for Multilingual Legal Judgement Prediction Dietrich Trautmann Alina Petrova Frank Schilder ELM AILaw 26 73 0 05 Dec 2022
Prompting Language Models for Linguistic Structure Terra Blevins Hila Gonen Luke Zettlemoyer LRM 22 39 0 15 Nov 2022
BLOOM: A 176B-Parameter Open-Access Multilingual Language Model BigScience Workshop : Teven Le Scao Angela Fan Christopher Akiki ... Zhongli Xie Zifan Ye M. Bras Younes Belkada Thomas Wolf VLM 65 2,301 0 09 Nov 2022
Transformers on Multilingual Clause-Level Morphology Emre Can Acikgoz T. Chubakov Muge Kural Gozde Gul cSahin Deniz Yuret 14 4 0 03 Nov 2022
Towards a neural architecture of language: Deep learning versus logistics of access in neural architectures for compositional processing F. Velde 8 0 0 19 Oct 2022
Language Generation Models Can Cause Harm: So What Can We Do About It? An Actionable Survey Sachin Kumar Vidhisha Balachandran Lucille Njoo Antonios Anastasopoulos Yulia Tsvetkov ELM 61 85 0 14 Oct 2022
Domain-Specific Text Generation for Machine Translation Yasmin Moslem Rejwanul Haque John D. Kelleher Andy Way 8 16 0 11 Aug 2022
Multitask Prompted Training Enables Zero-Shot Task Generalization Victor Sanh Albert Webson Colin Raffel Stephen H. Bach Lintang Sutawika ... T. Bers Stella Biderman Leo Gao Thomas Wolf Alexander M. Rush LRM 205 1,654 0 15 Oct 2021