Title
Web-Bench: A LLM Code Benchmark Based on Web Standards and Frameworks Kai Xu YiWei Mao XinYi Guan ZiLong Feng 14 0 0 12 May 2025
MxMoE: Mixed-precision Quantization for MoE with Accuracy and Performance Co-Design Haojie Duanmu Xiuhong Li Zhihang Yuan Size Zheng Jiangfei Duan Xingcheng Zhang Dahua Lin MQ MoE 57 0 0 09 May 2025
Hallucination by Code Generation LLMs: Taxonomy, Benchmarks, Mitigation, and Challenges Yunseo Lee John Youngeun Song Dongsun Kim Jindae Kim Mijung Kim Jaechang Nam HILM LRM 33 0 0 29 Apr 2025
Prefill-Based Jailbreak: A Novel Approach of Bypassing LLM Safety Boundary Yakai Li Jiekang Hu Weiduan Sang Luping Ma Jing Xie Weijuan Zhang Aimin Yu Shijie Zhao Qingjia Huang Qihang Zhou AAML 45 0 0 28 Apr 2025
CodeBC: A More Secure Large Language Model for Smart Contract Code Generation in Blockchain LingXiang Wang Hainan Zhang Qinnan Zhang Ziwei Wang Hongwei Zheng Jin Dong Zhiming Zheng 49 0 0 28 Apr 2025
Iterative Self-Training for Code Generation via Reinforced Re-Ranking Nikita Sorokin I. Sedykh Valentin Malykh 19 0 0 13 Apr 2025
From Token to Line: Enhancing Code Generation with a Long-Term Perspective Tingwei Lu Yangning Li Liyuan Wang Binghuai Lin Jiwei Tang ... Hai-tao Zheng Yinghui Li Bingxu An Zhao Wei Y. Xu LLMAG 55 0 0 10 Apr 2025
Multi-SWE-bench: A Multilingual Benchmark for Issue Resolving Daoguang Zan Zhirong Huang Wei Liu Hanwu Chen L. Zhang ... Jing Su Tianyu Liu Rui Long Kai Shen Liang Xiang 36 1 0 03 Apr 2025
On Benchmarking Code LLMs for Android Malware Analysis Yiling He Hongyu She Xingzhi Qian Xinran Zheng Zhuo Chen Z. Qin Lorenzo Cavallaro ELM 43 1 0 01 Apr 2025
WindowKV: Task-Adaptive Group-Wise KV Cache Window Selection for Efficient LLM Inference Youhui Zuo Sibo Wei C. Zhang Zhuorui Liu Wenpeng Lu Dawei Song VLM 51 0 0 23 Mar 2025
Large Language Models (LLMs) for Source Code Analysis: applications, models and datasets Hamed Jelodar Mohammad Meymani Roozbeh Razavi-Far 40 0 0 21 Mar 2025
Aligning Crowd-sourced Human Feedback for Reinforcement Learning on Code Generation by Large Language Models M. Wong C. Tan ALM 71 3 0 19 Mar 2025
CoDet-M4: Detecting Machine-Generated Code in Multi-Lingual, Multi-Generator and Multi-Domain Settings Daniil Orel Dilshod Azizov Preslav Nakov DeLMO 50 0 0 17 Mar 2025
A Survey on Transformer Context Extension: Approaches and Evaluation Yijun Liu Jinzheng Yu Yang Xu Zhongyang Li Qingfu Zhu LLMAG 64 0 0 17 Mar 2025
Fully Autonomous Programming using Iterative Multi-Agent Debugging with Large Language Models Anastasiia Grishina Vadim Liventsev Aki Härmä Leon Moonen ELM 74 0 0 10 Mar 2025
Advancing vision-language models in front-end development via data synthesis Tong Ge Yashu Liu Jieping Ye Tianyi Li Chao Wang 64 0 0 03 Mar 2025
Isolating Language-Coding from Problem-Solving: Benchmarking LLMs with PseudoEval Jiarong Wu Songqiang Chen Jialun Cao Hau Ching Lo S. Cheung 51 0 0 26 Feb 2025
An Analyst-Inspector Framework for Evaluating Reproducibility of LLMs in Data Science Qiuhai Zeng Claire Jin Xinyue Wang Yuhan Zheng Qunhua Li 38 0 0 23 Feb 2025
UniGenCoder: Merging Seq2Seq and Seq2Tree Paradigms for Unified Code Generation Liangying Shao Yanfu Yan Denys Poshyvanyk Jinsong Su 31 0 0 18 Feb 2025
Can Large Language Models Understand Intermediate Representations? Hailong Jiang Jianfeng Zhu Yao Wan B. Fang Hongyu Zhang Ruoming Jin Qiang Guan 48 1 0 07 Feb 2025
How Should We Build A Benchmark? Revisiting 274 Code-Related Benchmarks For LLMs Jialun Cao Yuk-Kit Chan Zixuan Ling Wenxuan Wang Shuqing Li ... Pinjia He Shuai Wang Zibin Zheng Michael R. Lyu S. Cheung ALM 69 2 0 18 Jan 2025
aiXcoder-7B: A Lightweight and Effective Large Language Model for Code Processing Siyuan Jiang Jia Li He Zong Huanyu Liu Hao Zhu ... Wei Ning G. Wang Yihong Dong Kechi Zhang Ge Li ALM 60 2 0 17 Jan 2025
WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct Haipeng Luo Qingfeng Sun Can Xu Pu Zhao Jian-Guang Lou ... Xiubo Geng Qingwei Lin Shifeng Chen Yansong Tang Dongmei Zhang OSLM LRM 93 402 0 03 Jan 2025
A Preliminary Study of Multilingual Code Language Models for Code Generation Task Using Translated Benchmarks Rohit Dandamudi Gema Rodríguez-Pérez ELM 69 0 0 23 Nov 2024
Parameter-Efficient Fine-Tuning of Large Language Models for Unit Test Generation: An Empirical Study André Storhaug Jingyue Li ALM 32 1 0 04 Nov 2024
A Deep Dive Into Large Language Model Code Generation Mistakes: What and Why? QiHong Chen Jiawei Li Jiecheng Deng Jiachen Yu Justin Tian Jin Chen Iftekhar Ahmed 42 0 0 03 Nov 2024
Improving Performance of Commercially Available AI Products in a Multi-Agent Configuration Cory Hymel Sida Peng Kevin Xu Charath Ranganathan LLMAG 19 0 0 29 Oct 2024
FALCON: Feedback-driven Adaptive Long/short-term memory reinforced Coding Optimization system Zeyuan Li Yangfan He Lewei He Jianhui Wang Tianyu Shi Bin Lei Yuchen Li Qiuwu Chen ALM 45 5 0 28 Oct 2024
Process Supervision-Guided Policy Optimization for Code Generation Ning Dai Zheng Wu Renjie Zheng Ziyun Wei Wenlei Shi Xing Jin Guanlin Liu Chen Dun Liang Huang Lin Yan 49 7 0 23 Oct 2024
From Solitary Directives to Interactive Encouragement! LLM Secure Code Generation by Natural Language Prompting Shigang Liu Bushra Sabir Seung Ick Jang Yuval Kansal Yansong Gao Kristen Moore A. Abuadbba Surya Nepal 20 2 0 18 Oct 2024
Mastering the Craft of Data Synthesis for CodeLLMs Meng Chen Philip Arthur Qianyu Feng Cong Duy Vu Hoang Yu-Heng Hong ... Mark Johnson K. K. Don Dharmasiri Long Duong Yuan-Fang Li SyDa 46 1 0 16 Oct 2024
Decoding Secret Memorization in Code LLMs Through Token-Level Characterization Yuqing Nie Chong Wang K. Wang Guoai Xu Guosheng Xu Haoyu Wang OffRL 37 0 0 11 Oct 2024
CursorCore: Assist Programming through Aligning Anything Hao Jiang Qi Liu Rui Li Shengyu Ye Shijin Wang 39 1 0 09 Oct 2024
CodeCipher: Learning to Obfuscate Source Code Against LLMs Yalan Lin Chengcheng Wan Yixiong Fang Xiaodong Gu 15 1 0 08 Oct 2024
An evaluation of LLM code generation capabilities through graded exercises Álvaro Barbero Jiménez ELM 20 0 0 06 Oct 2024
SWE-bench Multimodal: Do AI Systems Generalize to Visual Software Domains? John Yang Carlos E. Jimenez Alex Zhang K. Lieret Joyce Yang ... Gabriel Synnaeve Karthik Narasimhan Diyi Yang Sida I. Wang Ofir Press 24 17 0 04 Oct 2024
CodeJudge: Evaluating Code Generation with Large Language Models Weixi Tong Tianyi Zhang ELM ALM 13 7 0 03 Oct 2024
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? Zhenyu Pan Rongyu Cao Yongchang Cao Yingwei Ma Binhua Li Fei Huang Han Liu Yongbin Li 34 4 0 02 Oct 2024
RGD: Multi-LLM Based Agent Debugger via Refinement and Generation Guidance Haolin Jin Zechao Sun Huaming Chen LLMAG 43 2 0 02 Oct 2024
RouterDC: Query-Based Router by Dual Contrastive Learning for Assembling Large Language Models Shuhao Chen Weisen Jiang Baijiong Lin James T. Kwok Yu Zhang RALM MQ 35 5 0 30 Sep 2024
RAMBO: Enhancing RAG-based Repository-Level Method Body Completion Tuan-Dung Bui Duc-Thieu Luu-Van Thanh-Phat Nguyen Thu-Trang Nguyen Son Nguyen H. Vo 18 4 0 23 Sep 2024
Detection Made Easy: Potentials of Large Language Models for Solidity Vulnerabilities Md Tauseef Alam Raju Halder Abyayananda Maiti 16 2 0 15 Sep 2024
A Pair Programming Framework for Code Generation via Multi-Plan Exploration and Feedback-Driven Refinement Huan Zhang Wei Cheng Yuhan Wu Wei Hu LLMAG 31 1 0 08 Sep 2024
Multi-Programming Language Ensemble for Code Generation in Large Language Model Tengfei Xue Xuefeng Li Tahir Azim Roman Smirnov Jianhui Yu Arash Sadrieh Babak Pahlavan 13 2 0 06 Sep 2024
SWE-bench-java: A GitHub Issue Resolving Benchmark for Java Daoguang Zan Zhirong Huang Ailun Yu Shaoxin Lin Yifan Shi ... Bei Guan Pengjie Huang Tao Xie Yongji Wang Qianxiang Wang 21 7 0 26 Aug 2024
CodeJudge-Eval: Can Large Language Models be Good Judges in Code Understanding? Yuwei Zhao Ziyang Luo Yuchen Tian Hongzhan Lin Weixiang Yan Annan Li Jing Ma ELM ALM LRM 34 8 0 20 Aug 2024
What can Large Language Models Capture about Code Functional Equivalence? Nickil Maveli Antonio Vergari Shay B. Cohen 25 2 0 20 Aug 2024
Top Pass: Improve Code Generation by Pass@k-Maximized Code Ranking Zhi-Cun Lyu Xin-Ye Li Zheng Xie Ming Li 32 7 0 11 Aug 2024
COAST: Enhancing the Code Debugging Ability of LLMs through Communicative Agent Based Data Synthesis Weiqing Yang Hanbin Wang Zhenghao Liu Xinze Li Yukun Yan Shuo Wang Yu Gu Minghe Yu Zhiyuan Liu Ge Yu 35 2 0 09 Aug 2024
From LLMs to LLM-based Agents for Software Engineering: A Survey of Current, Challenges and Future Haolin Jin Linghan Huang Haipeng Cai Jun Yan Bo Li Huaming Chen 53 24 0 05 Aug 2024