22

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

9 November 2022

BigScience Workshop

:

Angela Fan

Christopher Akiki

Roman Castagné

Matthias Gallé

Alexander M. Rush

Stella Biderman

Pawan Sasanka Ammanamanchi

Niklas Muennighoff

Albert Villanova del Moral

Olatunji Ruwase

Angelina McMillan-Major

Lucile Saulnier

Pedro Ortiz Suarez

Hugo Laurenccon

Margaret Mitchell

Aitor Soroa Etxabe

Alham Fikri Aji

Ariel Kreisberg Nitzav

Chris C. Emezue

Christopher Klamm

Daniel Alexander van Strien

David Ifeoluwa Adelani

Dragomir R. Radev

E. G. Ponferrada

Efrat Levkovizh

Germán Kruszewski

Hamza Benyamina

Idris Abdulmumin

Itziar Gonzalez-Dios

Javier de la Rosa

Josephine Tobing

J. Bhattacharjee

Khalid Almubarak

Kyle Lo

Leandro von Werra

Loubna Ben Allal

María Grandury

Maximin Coavoux

Mike Tian-Jian Jiang

Nishant Subramani

Nurulaqilla Khamis

Peter Henderson

Priscilla Amuok

Rishi Bommasani

Sebastian Nagel

Shamsuddeen Hassan Muhammad

Somaieh Nikpoor

Tiago Timponi Torrent

Vassilina Nikoulina

Veronika Laippala

Violette Lepercq

Benjamin Heinzerling

Davut Emre Taşar

Elizabeth Salesky

Sabrina J. Mielke

Abheesht Sharma

Andrea Santilli

Antoine Chaffin

Arnaud Stiegler

Debajyoti Datta

Eliza Szczechla

Gunjan Chhablani

Han Wang

Hendrik Strobelt

Jason Alan Fries

Lintang Sutawika

Maged S. Al-Shaibani

Srulik Ben-David

Stephen H. Bach

Thibault Févry

Trishala Neeraj

Hyung Won Chung

Ofir Press

Deepak Narayanan

Hatim Bourfoune

Myriam Peyrounette

Omar Sanseviero

Patrick von Platen

Pierre Cornette

Pierre Franccois Lavallée

Samyam Rajbhandari

Tim Dettmers

Amanpreet Singh

Anastasia Cheveleva

Anne-Laure Ligozat

Arjun Subramonian

Aurélie Névéol

Charles Lovering

Daniel H Garrette

Ekaterina Taktasheva

Genta Indra Winata

Hailey Schoelkopf

Jan-Christoph Kalo

Jekaterina Novikova

Jessica Zosa Forde

Oskar van der Wal

Sebastian Gehrmann

Tatiana Shavrina

Tomasz Limisiewicz

Vitaly Protasov

Vladislav Mikhailov

Yada Pruksachatkun

Yonatan Belinkov

Zachary Bamberger

Zdeněk Kasner

Antigona Unldreaj

Arezoo Abdollahi

A. HajiHosseini

Bahareh Behroozi

Benjamin Ayoade Ajibade

Carlos Muñoz Ferrandis

Danish Contractor

Douwe Kiela

Ezinwanne Ozoani

Frankline Ononiwu

Habib Rezanejad

Indrani Bhattacharya

Julio Bonis Sanz

Mairon Samagaio

Marissa Gerchick

Martha Akinlolu

Michael McKenna

Olanrewaju Samuel

Abhinav Ramesh Kashyap

Alfredo Palasciano

Antonio Miranda-Escalada

Benjamin Beilharz

Clémentine Fourrier

Daniel León Perinán

Dian Yu

Enrique Manjavacas

Florian Fuhrimann

Giyaseddin Bayrak

Helena U. Vrabec

Karthi Sivaraman

Lokesh Bulchandani

Madeleine Hahn de Bykhovetz

Marianna Nezhurina

Matthias Samwald

Michael Weinberg

Patricia Haller

Rodrigo Canalli

Samuel Cahyawijaya

Shlok S Deshmukh

Shubhanshu Mishra

Sinee Sang-aroonsiri

Stefan Schweter

Abstract

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

Comments on this paper