IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators

6 March 2024

Papers citing "IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators"

18 / 18 papers shown

Title
Rethinking Multilingual Continual Pretraining: Data Mixing for Adapting LLMs Across Languages and Resources Zihao Li Shaoxiong Ji Hengyu Luo Jörg Tiedemann CLL 38 0 0 05 Apr 2025
ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding Indraneil Paul Haoyi Yang Goran Glavas Kristian Kersting Iryna Gurevych AAML SyDa 34 0 0 27 Mar 2025
Benchmarking AI Models in Software Engineering: A Review, Search Tool, and Enhancement Protocol Roham Koohestani Philippe de Bekker M. Izadi VLM 45 0 0 07 Mar 2025
Can Large Language Models Understand Intermediate Representations? Hailong Jiang Jianfeng Zhu Yao Wan B. Fang Hongyu Zhang Ruoming Jin Qiang Guan 48 1 0 07 Feb 2025
Bridge-Coder: Unlocking LLMs' Potential to Overcome Language Gaps in Low-Resource Code Jipeng Zhang Jianshu Zhang Yuanzhe Li Renjie Pi Rui Pan Runtao Liu Ziqiang Zheng Tong Zhang 26 0 0 24 Oct 2024
Generating Equivalent Representations of Code By A Self-Reflection Approach Jia Li Ge Li Lecheng Wang Hao Zhu Zhi Jin 16 1 0 04 Oct 2024
EMMA-500: Enhancing Massively Multilingual Adaptation of Large Language Models Shaoxiong Ji Zihao Li Indraneil Paul Jaakko Paavola Peiqin Lin ... Dayyán O'Brien Hengyu Luo Hinrich Schütze Jörg Tiedemann Barry Haddow CLL 31 3 0 26 Sep 2024
Meta Large Language Model Compiler: Foundation Models of Compiler Optimization Chris Cummins Volker Seeker Dejan Grubisic Baptiste Roziere Jonas Gehring Gabriel Synnaeve Hugh Leather 23 15 0 27 Jun 2024
A Survey on Large Language Models for Code Generation Juyong Jiang Fan Wang Jiasi Shen Sungju Kim Sunghun Kim 35 74 0 01 Jun 2024
Continual Learning of Large Language Models: A Comprehensive Survey Haizhou Shi Zihao Xu Hengyi Wang Weiyi Qin Wenyuan Wang Yibin Wang Zifeng Wang Sayna Ebrahimi Hao Wang CLL KELM LRM 37 62 0 25 Apr 2024
Multi-line AI-assisted Code Authoring Omer Dunay Daniel Cheng Adam Tait Parth Thakkar Peter C. Rigby ... Arun Ganesan C. Maddila V. Murali Ali Tayyebi Nachiappan Nagappan KELM 46 5 0 06 Feb 2024
Breaking the Curse of Multilinguality with Cross-lingual Expert Language Models Terra Blevins Tomasz Limisiewicz Suchin Gururangan Margaret Li Hila Gonen Noah A. Smith Luke Zettlemoyer 42 22 0 19 Jan 2024
Multi-lingual Evaluation of Code Generation Models Ben Athiwaratkun Sanjay Krishna Gouda Zijian Wang Xiaopeng Li Yuchen Tian ... Baishakhi Ray Parminder Bhatia Sudipta Sengupta Dan Roth Bing Xiang ELM 101 117 0 26 Oct 2022
NL-Augmenter: A Framework for Task-Sensitive Natural Language Augmentation Kaustubh D. Dhole Varun Gangal Sebastian Gehrmann Aadesh Gupta Zhenhao Li ... Tianbao Xie Usama Yaseen Michael A. Yee Jing Zhang Yue Zhang 153 86 0 06 Dec 2021
AugmentedCode: Examining the Effects of Natural Language Resources in Code Retrieval Models M. Bahrami N. Shrikanth Yuji Mizobuchi Lei Liu M. Fukuyori Wei-Peng Chen Kazuki Munakata 16 3 0 16 Oct 2021
Deduplicating Training Data Makes Language Models Better Katherine Lee Daphne Ippolito A. Nystrom Chiyuan Zhang Douglas Eck Chris Callison-Burch Nicholas Carlini SyDa 234 447 0 14 Jul 2021
Measuring Coding Challenge Competence With APPS Dan Hendrycks Steven Basart Saurav Kadavath Mantas Mazeika Akul Arora ... Collin Burns Samir Puranik Horace He D. Song Jacob Steinhardt ELM AIMat ALM 189 614 0 20 May 2021
CodeXGLUE: A Machine Learning Benchmark Dataset for Code Understanding and Generation Shuai Lu Daya Guo Shuo Ren Junjie Huang Alexey Svyatkovskiy ... Nan Duan Neel Sundaresan Shao Kun Deng Shengyu Fu Shujie Liu ELM 186 853 0 09 Feb 2021