GPT-SW3: An Autoregressive Language Model for the Nordic Languages

22 May 2023

Papers citing "GPT-SW3: An Autoregressive Language Model for the Nordic Languages"

7 / 7 papers shown

Title
Towards Multilingual LLM Evaluation for Baltic and Nordic languages: A study on Lithuanian History Yevhen Kostiuk O. Vitman Łukasz Gagała Artur Kiulian ELM 59 0 0 17 Jan 2025
How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? Ehsan Doostmohammadi Oskar Holmstrom Marco Kuhlmann 22 2 0 16 Feb 2024
Continual Learning Under Language Shift Evangelia Gogoulou Timothée Lesort Magnus Boman Joakim Nivre KELM CLL 14 2 0 02 Nov 2023
The Less the Merrier? Investigating Language Representation in Multilingual Models H. Nigatu A. Tonja Jugal Kalita 8 0 0 20 Oct 2023
Tokenizer Choice For LLM Training: Negligible or Crucial? Mehdi Ali Michael Fromm Klaudia Thellmann Richard Rutmann Max Lübbering ... Malte Ostendorff Samuel Weinbach R. Sifa Stefan Kesselheim Nicolas Flores-Herr 11 47 0 12 Oct 2023
Training and Evaluation of a Multilingual Tokenizer for GPT-SW3 Felix Stollenwerk 13 7 0 28 Apr 2023
The Pile: An 800GB Dataset of Diverse Text for Language Modeling Leo Gao Stella Biderman Sid Black Laurence Golding Travis Hoppe ... Horace He Anish Thite Noa Nabeshima Shawn Presser Connor Leahy AIMat 239 1,508 0 31 Dec 2020