v1v2v3 (latest)

Mastering the Craft of Data Synthesis for CodeLLMs

North American Chapter of the Association for Computational Linguistics (NAACL), 2024

16 October 2024

Mahdi Kazemi Moghaddam

Papers citing "Mastering the Craft of Data Synthesis for CodeLLMs"

14 / 64 papers shown

Large Language Models Meet NL2Code: A SurveyAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Daoguang Zan

237

236

19 Dec 2022

CodeExp: Explanatory Code Document GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Chenglong Wang

158

25 Nov 2022

DS-1000: A Natural and Reliable Benchmark for Data Science Code GenerationInternational Conference on Machine Learning (ICML), 2022

Ruiqi Zhong

Luke Zettlemoyer

Daniel Fried

275

443

18 Nov 2022

Language Models Can Teach Themselves to Program BetterInternational Conference on Learning Representations (ICLR), 2022

Patrick M. Haluptzok

Matthew Bowers

Adam Tauman Kalai

ReLM SyDa LRM

362

29 Jul 2022

Compilable Neural Code Generation with Compiler FeedbackFindings (Findings), 2022

Xin Jiang

Qun Liu

209

10 Mar 2022

Training Verifiers to Solve Math Word Problems

...

1.1K

6,810

27 Oct 2021

Program Synthesis with Large Language Models

Henryk Michalewski

...

419

2,869

16 Aug 2021

Deduplicating Training Data Makes Language Models Better

717

770

14 Jul 2021

Evaluating Large Language Models Trained on Code

...

2.1K

7,722

07 Jul 2021

Measuring Coding Challenge Competence With APPS

...

1.2K

910

20 May 2021

The Pile: An 800GB Dataset of Diverse Text for Language Modeling

...

910

2,546

31 Dec 2020

RoBERTa: A Robustly Optimized BERT Pretraining Approach

Luke Zettlemoyer

4.0K

27,917

26 Jul 2019

A Survey of Machine Learning for Big Code and Naturalness

415

941

18 Sep 2017

Bag of Tricks for Efficient Text ClassificationConference of the European Chapter of the Association for Computational Linguistics (EACL), 2016

1.2K

4,888

06 Jul 2016