Papers citing "Evaluating Large Language Models Trained on Code"

50 / 908 papers shown

Title
Privacy Preserving Large Language Models: ChatGPT Case Study Based Vision and Framework Imdad Ullah Najm Hassan S. Gill Basem Suleiman T. Ahanger Zawar Shah Junaid Qadir S. Kanhere 40 16 0 19 Oct 2023
Semantic Parsing by Large Language Models for Intricate Updating Strategies of Zero-Shot Dialogue State Tracking Yuxiang Wu Guanting Dong Weiran Xu 38 3 0 16 Oct 2023
Tabular Representation, Noisy Operators, and Impacts on Table Structure Understanding Tasks in LLMs Ananya Singha J. Cambronero Sumit Gulwani Vu Le Chris Parnin LMTD 20 32 0 16 Oct 2023
AdaLomo: Low-memory Optimization with Adaptive Learning Rate Kai Lv Hang Yan Qipeng Guo Haijun Lv Xipeng Qiu ODL 25 20 0 16 Oct 2023
Configuration Validation with Large Language Models Xinyu Lian Yinfang Chen Runxiang Cheng Jie Huang Parth Thakkar Minjia Zhang Tianyin Xu 18 10 0 15 Oct 2023
CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules Hung Le Hailin Chen Amrita Saha Akash Gokul Doyen Sahoo Shafiq R. Joty LRM 28 42 0 13 Oct 2023
GLoRE: Evaluating Logical Reasoning of Large Language Models Hanmeng Liu Zhiyang Teng Ruoxi Ning Jian Liu Qiji Zhou Yuexin Zhang Yue Zhang ReLM ELM LRM 70 7 0 13 Oct 2023
CoLadder: Supporting Programmers with Hierarchical Code Generation in Multi-Level Abstraction Ryan Yen Jiawen Zhu Sangho Suh Haijun Xia Jian Zhao 40 14 0 12 Oct 2023
Towards Causal Deep Learning for Vulnerability Detection Md. Mahbubur Rahman Ira Ceka Chengzhi Mao Saikat Chakraborty Baishakhi Ray Wei Le 20 10 0 12 Oct 2023
Forgetful Large Language Models: Lessons Learned from Using LLMs in Robot Programming Juo-Tung Chen Chien-Ming Huang LLMAG 19 12 0 10 Oct 2023
Words into Action: Learning Diverse Humanoid Robot Behaviors using Language Guided Iterative Motion Refinement K. N. Kumar Irfan Essa Sehoon Ha 24 6 0 10 Oct 2023
Recurrent Neural Language Models as Probabilistic Finite-state Automata Anej Svete Ryan Cotterell 32 2 0 08 Oct 2023
Toolink: Linking Toolkit Creation and Using through Chain-of-Solving on Open-Source Model Cheng Qian Chenyan Xiong Zhenghao Liu Zhiyuan Liu LRM 29 12 0 08 Oct 2023
DialCoT Meets PPO: Decomposing and Exploring Reasoning Paths in Smaller Language Models Chengcheng Han Xiaowei Du Che Zhang Yixin Lian Xiang Li Ming Gao Baoyuan Wang LRM 34 14 0 08 Oct 2023
LLM4DV: Using Large Language Models for Hardware Test Stimuli Generation Zixi Zhang Greg Chadwick Hugo McNally Yiren Zhao Robert D. Mullins Jianyi Cheng Robert Mullins Yiren Zhao 26 19 0 06 Oct 2023
Concise and Organized Perception Facilitates Reasoning in Large Language Models Junjie Liu Shaotian Yan Chen Shen Zhengdong Xiao Wenxiao Wang Jieping Ye Jieping Ye LRM 23 1 0 05 Oct 2023
Necessary and Sufficient Watermark for Large Language Models Yuki Takezawa Ryoma Sato Han Bao Kenta Niwa Makoto Yamada WaLM 50 7 0 02 Oct 2023
Neuro Symbolic Reasoning for Planning: Counterexample Guided Inductive Synthesis using Large Language Models and Satisfiability Solving Matthias Zeller Susmit Jha Patrick Lincoln Jens Behley Alvaro Velasquez Rickard Ewetz C. Stachniss LRM 20 7 0 28 Sep 2023
LawBench: Benchmarking Legal Knowledge of Large Language Models Zhiwei Fei Xiaoyu Shen D. Zhu Fengzhe Zhou Zhuo Han Songyang Zhang Kai-xiang Chen Zongwen Shen Jidong Ge ELM AILaw 28 34 0 28 Sep 2023
Rethinking Channel Dimensions to Isolate Outliers for Low-bit Weight Quantization of Large Language Models Jung Hwan Heo Jeonghoon Kim Beomseok Kwon Byeongwook Kim Se Jung Kwon Dongsoo Lee MQ 40 9 0 27 Sep 2023
Frustrated with Code Quality Issues? LLMs can Help! Nalin Wadhwa Jui Pradhan Atharv Sonwane Surya Prakash Sahu Nagarajan Natarajan Aditya Kanade Suresh Parthasarathy S. Rajamani 30 2 0 22 Sep 2023
Foundation Metrics for Evaluating Effectiveness of Healthcare Conversations Powered by Generative AI Mahyar Abbasian Elahe Khatibi Iman Azimi David Oniani Zahra Shakeri Hossein Abad ... Bryant Lin Olivier Gevaert Li-Jia Li Ramesh C. Jain Amir M. Rahmani LM&MA ELM AI4MH 37 66 0 21 Sep 2023
Reranking for Natural Language Generation from Logical Forms: A Study based on Large Language Models Levon Haroutunian Zhuang Li Lucian Galescu Philip R. Cohen Raj Tumuluri Gholamreza Haffari LRM 26 1 0 21 Sep 2023
SG-Bot: Object Rearrangement via Coarse-to-Fine Robotic Imagination on Scene Graphs Guangyao Zhai Xiaoni Cai Dianye Huang Yan Di Fabian Manhardt Federico Tombari Nassir Navab Benjamin Busam LM&Ro 24 27 0 21 Sep 2023
BTLM-3B-8K: 7B Parameter Performance in a 3B Parameter Model Nolan Dey Daria Soboleva Faisal Al-Khateeb Bowen Yang Ribhu Pathria ... Robert Myers Jacob Robert Steeves Natalia Vassilieva Marvin Tom Joel Hestness MoE 19 14 0 20 Sep 2023
GPT4AIGChip: Towards Next-Generation AI Accelerator Design Automation via Large Language Models Yonggan Fu Yongan Zhang Zhongzhi Yu Sixu Li Zhifan Ye Chaojian Li Cheng Wan Ying Lin 46 60 0 19 Sep 2023
Baichuan 2: Open Large-scale Language Models Ai Ming Yang Bin Xiao Bingning Wang Borong Zhang Ce Bian ... Youxin Jiang Yuchen Gao Yupeng Zhang Zenan Zhou Zhiying Wu ELM LRM 66 703 0 19 Sep 2023
Data Distribution Bottlenecks in Grounding Language Models to Knowledge Bases Yiheng Shu Zhiwei Yu 24 3 0 15 Sep 2023
Demystifying RCE Vulnerabilities in LLM-Integrated Apps Tong Liu Zizhuang Deng Guozhu Meng Yuekang Li Kai Chen SILM 36 19 0 06 Sep 2023
Cognitive Architectures for Language Agents T. Sumers Shunyu Yao Karthik Narasimhan Thomas L. Griffiths LLMAG LM&Ro 51 152 0 05 Sep 2023
Bias Testing and Mitigation in LLM-based Code Generation Dong Huang Qingwen Bu Jie M. Zhang Xiaofei Xie Junjie Chen Heming Cui 43 20 0 03 Sep 2023
Amortizing Pragmatic Program Synthesis with Rankings Yewen Pu Saujas Vaduguru Priyan Vaithilingam Elena L. Glassman Daniel Fried 22 3 0 01 Sep 2023
AI-Generated Content (AIGC) for Various Data Modalities: A Survey Lin Geng Foo Hossein Rahmani Xiaozhong Liu 78 31 0 27 Aug 2023
Exploring the Effectiveness of GPT Models in Test-Taking: A Case Study of the Driver's License Knowledge Test Saba Rahimi T. Balch Manuela Veloso ELM 26 1 0 22 Aug 2023
RAVEN: In-Context Learning with Retrieval-Augmented Encoder-Decoder Language Models Jie Huang Wei Ping Peng-Tao Xu M. Shoeybi Kevin Chen-Chuan Chang Bryan Catanzaro RALM 32 33 0 15 Aug 2023
Large Language Models and Foundation Models in Smart Agriculture: Basics, Opportunities, and Challenges Jiajia Li Mingle Xu Lirong Xiang Dong Chen Weichao Zhuang Xunyuan Yin Zhao Li 33 3 0 13 Aug 2023
Enhancing Network Management Using Code Generated by Large Language Models Sathiya Kumaran Mani Yajie Zhou Kevin Hsieh Santiago Segarra Ranveer Chandra Srikanth Kandula 36 22 0 11 Aug 2023
Investigating disaster response through social media data and the Susceptible-Infected-Recovered (SIR) model: A case study of 2020 Western U.S. wildfire season Zihui Ma Lingyao Li Libby Hemphill G. Baecher Yubai Yuan 105 0 0 10 Aug 2023
A Cost Analysis of Generative Language Models and Influence Operations Micah Musser 32 19 0 07 Aug 2023
Towards General Text Embeddings with Multi-stage Contrastive Learning Zehan Li Xin Zhang Yanzhao Zhang Dingkun Long Pengjun Xie Meishan Zhang 56 342 0 07 Aug 2023
Automated Distractor and Feedback Generation for Math Multiple-choice Questions via In-context Learning Hunter McNichols Wanyong Feng Jaewook Lee Alexander Scarlatos Digory Smith Simon Woodhead Andrew S. Lan AI4Ed 19 26 0 07 Aug 2023
An Empirical Study of AI-based Smart Contract Creation Rabimba Karanjai Edward Li Lei Xu W. Shi 16 9 0 05 Aug 2023
From Prompt Injections to SQL Injection Attacks: How Protected is Your LLM-Integrated Web Application? Rodrigo Pedro Daniel Castro Paulo Carreira Nuno Santos SILM AAML 36 50 0 03 Aug 2023
CodeBPE: Investigating Subtokenization Options for Large Language Model Pretraining on Source Code Nadezhda Chirkova Sergey Troshin 21 8 0 01 Aug 2023
The Hitchhiker's Guide to Program Analysis: A Journey with Large Language Models Haonan Li Yu Hao Yizhuo Zhai Zhiyun Qian LLMAG 30 25 0 01 Aug 2023
Evaluating ChatGPT and GPT-4 for Visual Programming Adish Singla 19 20 0 30 Jul 2023
RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control Anthony Brohan Noah Brown Justice Carbajal Yevgen Chebotar Xi Chen ... Ted Xiao Peng-Tao Xu Sichun Xu Tianhe Yu Brianna Zitkovich LM&Ro LRM 30 1,099 0 28 Jul 2023
Three Bricks to Consolidate Watermarks for Large Language Models Pierre Fernandez Antoine Chaffin Karim Tit Vivien Chappelier Teddy Furon WaLM 19 47 0 26 Jul 2023
Foundational Models Defining a New Era in Vision: A Survey and Outlook Muhammad Awais Muzammal Naseer Salman Khan Rao Muhammad Anwer Hisham Cholakkal M. Shah Ming Yang F. Khan VLM 38 118 0 25 Jul 2023
Opinion Mining Using Population-tuned Generative Language Models Allmin Pradhap Singh Susaiyah Abhinay Pandya Aki Härmä 15 0 0 24 Jul 2023