Breaking Language Barriers: Cross-Lingual Continual Pre-Training at Scale

2 July 2024

Papers citing "Breaking Language Barriers: Cross-Lingual Continual Pre-Training at Scale"

5 / 5 papers shown

Title
Elastic Weight Consolidation for Full-Parameter Continual Pre-Training of Gemma2 Vytenis Šliogeris Povilas Daniušis Arturas Nakvosas CLL 30 0 0 09 May 2025
Enhancing LLM Language Adaption through Cross-lingual In-Context Pre-training Linjuan Wu H. Wei Huan Lin Tianhao Li Baosong Yang Weiming Lu 26 0 0 29 Apr 2025
SEA-LION: Southeast Asian Languages in One Network Raymond Ng Thanh Ngan Nguyen Yuli Huang Ngee Chia Tai Wai Yi Leong ... David Ong Tat-Wee B. Liu William-Chandra Tjhi Erik Cambria Leslie Teo 34 11 0 08 Apr 2025
Scaling Laws for Fine-Grained Mixture of Experts Jakub Krajewski Jan Ludziejewski Kamil Adamczewski Maciej Pióro Michal Krutul ... Krystian Król Tomasz Odrzygó'zd'z Piotr Sankowski Marek Cygan Sebastian Jaszczur MoE 40 53 0 12 Feb 2024
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 220 4,424 0 23 Jan 2020