Do Llamas Work in English? On the Latent Language of Multilingual Transformers

16 February 2024

Papers citing "Do Llamas Work in English? On the Latent Language of Multilingual Transformers"

50 / 77 papers shown

Title
Unveiling Language-Specific Features in Large Language Models via Sparse Autoencoders Boyi Deng Yu Wan Yidan Zhang Baosong Yang Fuli Feng 34 0 0 08 May 2025
Enhancing Non-Core Language Instruction-Following in Speech LLMs via Semi-Implicit Cross-Lingual CoT Reasoning Hongfei Xue Yufeng Tang Hexin Liu Jun Zhang Xuelong Geng Lei Xie LRM 50 0 0 29 Apr 2025
What's the Difference? Supporting Users in Identifying the Effects of Prompt and Model Changes Through Token Patterns Michael A. Hedderich Anyi Wang Raoyuan Zhao Florian Eichin Barbara Plank 22 0 0 22 Apr 2025
Trillion 7B Technical Report Sungjun Han Juyoung Suk Suyeong An Hyungguk Kim Kyuseok Kim Wonsuk Yang Seungtaek Choi Jamin Shin 27 0 0 21 Apr 2025
Linking forward-pass dynamics in Transformers and real-time human processing Jennifer Hu Michael A. Lepori Michael Franke AI4CE 45 0 0 18 Apr 2025
Localized Cultural Knowledge is Conserved and Controllable in Large Language Models V. Veselovsky Berke Argin Benedikt Stroebl Chris Wendler Robert West James Evans Thomas L. Griffiths Arvind Narayanan 53 0 0 14 Apr 2025
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs Kartik Ravisankar HyoJung Han Marine Carpuat 21 0 0 13 Apr 2025
SEA-LION: Southeast Asian Languages in One Network Raymond Ng Thanh Ngan Nguyen Yuli Huang Ngee Chia Tai Wai Yi Leong ... David Ong Tat-Wee B. Liu William-Chandra Tjhi Erik Cambria Leslie Teo 31 11 0 08 Apr 2025
Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models Mingyang Wang Heike Adel Lukas Lange Yihong Liu Ercong Nie Jannik Strötgen Hinrich Schütze HILM 56 0 0 05 Apr 2025
Page Classification for Print Imaging Pipeline Shaoyuan Xu Cheng Lu Mark Shaw Peter Bauer J. Allebach VLM 35 1 0 03 Apr 2025
MultiBLiMP 1.0: A Massively Multilingual Benchmark of Linguistic Minimal Pairs Jaap Jumelet Leonie Weissweiler Arianna Bisazza 38 2 0 03 Apr 2025
Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure Boshi Wang Huan Sun 31 2 0 02 Apr 2025
Scaling Test-time Compute for Low-resource Languages: Multilingual Reasoning in LLMs Khanh-Tung Tran Barry O’Sullivan Hoang D. Nguyen LRM 32 0 0 02 Apr 2025
JiraiBench: A Bilingual Benchmark for Evaluating Large Language Models' Detection of Human Self-Destructive Behavior Content in Jirai Community Yunze Xiao Tingyu He Lionel Z. Wang Yiming Ma Xingyu Song Xiaohang Xu Irene Z Li Ka Chung Ng 48 0 0 27 Mar 2025
PM4Bench: A Parallel Multilingual Multi-Modal Multi-task Benchmark for Large Vision Language Model Junyuan Gao Jiahe Song J. Wu Runchuan Zhu Guanlin Shen ... Weijia Li Bin Wang D. Lin Lijun Wu Conghui He 79 0 0 24 Mar 2025
High-Dimensional Interlingual Representations of Large Language Models Bryan Wilie Samuel Cahyawijaya Junxian He Pascale Fung 50 0 0 14 Mar 2025
Probing LLMs for Multilingual Discourse Generalization Through a Unified Label Set Florian Eichin Y. Liu Barbara Plank Michael A. Hedderich 39 0 0 13 Mar 2025
Multilingual Relative Clause Attachment Ambiguity Resolution in Large Language Models So Young Lee Russell Scheinberg Amber Shore Ameeta Agrawal 44 0 0 04 Mar 2025
On Relation-Specific Neurons in Large Language Models Yihong Liu Runsheng Chen Lea Hirlimann Ahmad Dawar Hakimi Mingyang Wang Amir Hossein Kargaran S. Rothe François Yvon Hinrich Schütze KELM 28 0 0 24 Feb 2025
Do Multilingual LLMs Think In English? Lisa Schut Y. Gal Sebastian Farquhar 35 3 0 24 Feb 2025
Steering into New Embedding Spaces: Analyzing Cross-Lingual Alignment Induced by Model Interventions in Multilingual Language Models Anirudh Sundar Sinead Williamson Katherine Metcalf B. Theobald Skyler Seto Masha Fedzechkina LLMSV 72 0 0 24 Feb 2025
How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations Hyunji Lee Danni Liu Supriti Sinhamahapatra Jan Niehues 103 0 0 21 Feb 2025
Exploring Translation Mechanism of Large Language Models Hongbin Zhang Kehai Chen Xuefeng Bai Xiucheng Li Yang Xiang Min Zhang 49 1 0 17 Feb 2025
Blessing of Multilinguality: A Systematic Analysis of Multilingual In-Context Learning Yilei Tu Andrew Xue Freda Shi 49 0 0 17 Feb 2025
Beyond Literal Token Overlap: Token Alignability for Multilinguality Katharina Hämmerl Tomasz Limisiewicz Jindrich Libovický Alexander M. Fraser 40 0 0 10 Feb 2025
Large Language Models Are Human-Like Internally Tatsuki Kuribayashi Yohei Oseki Souhaib Ben Taieb Kentaro Inui Timothy Baldwin 51 4 0 03 Feb 2025
AdaCoT: Rethinking Cross-Lingual Factual Reasoning through Adaptive Chain-of-Thought Xin Huang Tarun K. Vangani Zhengyuan Liu Bowei Zou A. Aw LRM AI4CE 53 0 0 27 Jan 2025
Language Fusion for Parameter-Efficient Cross-lingual Transfer Philipp Borchert Ivan Vulić Marie-Francine Moens Jochen De Weerdt 36 0 0 12 Jan 2025
Large Language Models Share Representations of Latent Grammatical Concepts Across Typologically Diverse Languages Jannik Brinkmann Chris Wendler Christian Bartelt Aaron Mueller 41 9 0 10 Jan 2025
SLAM: Towards Efficient Multilingual Reasoning via Selective Language Alignment Yuchun Fan Yongyu Mu Yilin Wang Lei Huang Junhao Ruan B. Li Tong Xiao Shujian Huang Xiaocheng Feng Jingbo Zhu LRM 43 3 0 08 Jan 2025
Training Bilingual LMs with Data Constraints in the Targeted Language Skyler Seto Maartje ter Hoeve He Bai Natalie Schluter David Grangier 71 0 0 20 Nov 2024
The Semantic Hub Hypothesis: Language Models Share Semantic Representations Across Languages and Modalities Zhaofeng Wu Xinyan Velocity Yu Dani Yogatama Jiasen Lu Yoon Kim AIFin 41 10 0 07 Nov 2024
Thank You, Stingray: Multilingual Large Language Models Can Not (Yet) Disambiguate Cross-Lingual Word Sense Samuel Cahyawijaya Ruochen Zhang Holy Lovenia Jan Christian Blaise Cruz Elisa Gilbert Hiroki Nomoto Alham Fikri Aji LRM 28 0 0 28 Oct 2024
Looking Beyond The Top-1: Transformers Determine Top Tokens In Order Daria Lioubashevski Tomer Schlank Gabriel Stanovsky Ariel Goldstein 29 1 0 26 Oct 2024
Multilingual Hallucination Gaps in Large Language Models Cléa Chataigner Afaf Taik G. Farnadi HILM LRM 27 3 0 23 Oct 2024
Towards Understanding the Fragility of Multilingual LLMs against Fine-Tuning Attacks Samuele Poppi Zheng-Xin Yong Yifei He Bobbie Chern Han Zhao Aobo Yang Jianfeng Chi AAML 43 11 0 23 Oct 2024
Do Large Language Models Have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs Yanzhu Guo Simone Conia Zelin Zhou Min Li Saloni Potdar Henry Xiao 25 1 0 21 Oct 2024
An Evolved Universal Transformer Memory Edoardo Cetin Qi Sun Tianyu Zhao Yujin Tang 38 0 0 17 Oct 2024
FiRST: Finetuning Router-Selective Transformers for Input-Adaptive Latency Reduction Akriti Jain Saransh Sharma Koyel Mukherjee Soumyabrata Pal 14 1 0 16 Oct 2024
Evaluating Morphological Compositional Generalization in Large Language Models Mete Ismayilzada Defne Çirci Jonne Sälevä Hale Sirin Abdullatif Köksal Bhuwan Dhingra Antoine Bosselut Lonneke van der Plas Duygu Ataman 26 2 0 16 Oct 2024
Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language Models Hongchuan Zeng Senyu Han Lu Chen Kai Yu 38 5 0 15 Oct 2024
The Same But Different: Structural Similarities and Differences in Multilingual Language Modeling Ruochen Zhang Qinan Yu Matianyu Zang Carsten Eickhoff Ellie Pavlick 33 1 0 11 Oct 2024
Mitigating the Language Mismatch and Repetition Issues in LLM-based Machine Translation via Model Editing Weichuan Wang Zhaoyi Li Defu Lian Chen Ma Linqi Song Ying Wei 33 5 0 09 Oct 2024
On the Similarity of Circuits across Languages: a Case Study on the Subject-verb Agreement Task Javier Ferrando Marta R. Costa-jussá 18 5 0 09 Oct 2024
Towards Interpreting Visual Information Processing in Vision-Language Models Clement Neo Luke Ong Philip H. S. Torr Mor Geva David M. Krueger Fazl Barez 78 6 0 09 Oct 2024
MEXA: Multilingual Evaluation of English-Centric LLMs via Cross-Lingual Alignment Amir Hossein Kargaran Ali Modarressi Nafiseh Nikeghbal Jana Diesner François Yvon Hinrich Schütze ELM 33 3 0 08 Oct 2024
MINER: Mining the Underlying Pattern of Modality-Specific Neurons in Multimodal Large Language Models Kaichen Huang Jiahao Huo Yibo Yan Kun Wang Yutao Yue Xuming Hu 25 2 0 07 Oct 2024
CiMaTe: Citation Count Prediction Effectively Leveraging the Main Text Jun Hirako Ryohei Sasano Koichi Takeda 26 1 0 06 Oct 2024
Layer Swapping for Zero-Shot Cross-Lingual Transfer in Large Language Models Lucas Bandarkar Benjamin Muller Pritish Yuvraj Rui Hou Nayan Singhal Hongjiang Lv Bing-Quan Liu KELM LRM MoMe 21 2 0 02 Oct 2024
Duo-LLM: A Framework for Studying Adaptive Computation in Large Language Models Keivan Alizadeh Iman Mirzadeh Hooman Shahrokhi Dmitry Belenko Frank Sun Minsik Cho Mohammad Hossein Sekhavat Moin Nabi Mehrdad Farajtabar MoE 11 1 0 01 Oct 2024