v1v2v3v4v5 (latest)

AlpaGasus: Training A Better Alpaca with Fewer Data

17 July 2023

Vikas Yadav

ArXiv (abs)PDF HTML HuggingFace (23 upvotes)

Papers citing "AlpaGasus: Training A Better Alpaca with Fewer Data"

50 / 189 papers shown

Generalized Out-of-Distribution Detection and Beyond in Vision Language Model Era: A Survey

...

376

31 Jul 2024

SynthVLM: Towards High-Quality and Efficient Synthesis of Image-Caption Datasets for Vision-Language Models

489

30 Jul 2024

Meta-Rewarding Language Models: Self-Improving Alignment with LLM-as-a-Meta-Judge

Jason Weston

377

156

28 Jul 2024

Right Now, Wrong Then: Non-Stationary Direct Preference Optimization under Preference Drift

444

26 Jul 2024

Quality Assured: Rethinking Annotation Strategies in Imaging AI

Annette Kopp-Schneider

Lena Maier-Hein

240

24 Jul 2024

Entropy Law: The Story Behind Data Compression and LLM Performance

Mingjia Yin

Chuhan Wu

Yufei Wang

Hao Wang

Wei Guo

314

09 Jul 2024

LIONs: An Empirically Optimized Approach to Align Language Models

Zhou Yu

261

09 Jul 2024

PAS: Data-Efficient Plug-and-Play Prompt Augmentation System

...

Bin Cui

Wentao Zhang

Guosheng Dong

RALM

275

08 Jul 2024

KeyVideoLLM: Towards Large-scale Video Keyframe Selection

Hao Liang

Jiapeng Li

Conghui He

Bin Cui

Chong Chen

Wentao Zhang

VGen

331

03 Jul 2024

Efficient-Empathy: Towards Efficient and Effective Selection of Empathy Data

Hao Liang

Bin Cui

Wentao Zhang

187

02 Jul 2024

Curriculum Learning with Quality-Driven Data Selection

Biao Wu

Fang Meng

435

27 Jun 2024

Weak Reward Model Transforms Generative Models into Robust Causal Event Extraction Systems

372

26 Jun 2024

On the Transformations across Reward Model, Parameter Update, and In-Context Prompt

...

Leyang Cui

238

24 Jun 2024

M2Lingual: Enhancing Multilingual, Multi-Turn Instruction Alignment in Large Language Models

Sathwik Tejaswi Madhusudhan

484

24 Jun 2024

Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models

Ziche Liu

Rui Ke

Feng Jiang

Haizhou Li

328

20 Jun 2024

DART-Math: Difficulty-Aware Rejection Tuning for Mathematical Problem-Solving

244

18 Jun 2024

The Right Time Matters: Data Arrangement Affects Zero-Shot Generalization in Instruction Tuning

Bingxiang He

Ning Ding

Cheng Qian

Jia Deng

Ganqu Cui

...

Longtao Huang

Hui Xue

Huimin Chen

Zhiyuan Liu

Maosong Sun

198

17 Jun 2024

Concept-skill Transferability-based Data Selection for Large Vision-Language Models

Jaewoo Lee

Boyang Li

Sung Ju Hwang

VLM

298

16 Jun 2024

SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking

415

16 Jun 2024

On LLMs-Driven Synthetic Data Generation, Curation, and Evaluation: A SurveyAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Lin Long

Rui Wang

Ruixuan Xiao

Junbo Zhao

Xiao Ding

Gang Chen

Haobo Wang

SyDa

303

265

14 Jun 2024

Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing

Yejin Choi

Bill Yuchen Lin

SyDa

356

266

12 Jun 2024

OPTune: Efficient Online Preference Tuning

Tom Goldstein

Heng Huang

130

11 Jun 2024

Large Language Model-guided Document Selection

Xiang Kong

Tom Gunter

Ruoming Pang

198

07 Jun 2024

Towards Detecting LLMs Hallucination via Markov Chain-based Multi-agent Debate Framework

258

05 Jun 2024

Is In-Context Learning Sufficient for Instruction Following in LLMs?

Hao Zhao

Maksym Andriushchenko

Francesco Croce

Nicolas Flammarion

464

30 May 2024

A Survey of Multimodal Large Language Model from A Data-centric Perspective

...

Conghui He

404

26 May 2024

SimPO: Simple Preference Optimization with a Reference-Free RewardNeural Information Processing Systems (NeurIPS), 2024

Yu Meng

Mengzhou Xia

Danqi Chen

543

791

23 May 2024

DynaMo: Accelerating Language Model Inference with Dynamic Multi-Token Sampling

165

01 May 2024

A Survey on Self-Evolution of Large Language Models

Ting-En Lin

Fei Huang

Jingren Zhou

303

22 Apr 2024

Post-Hoc Reversal: Are We Selecting Models Prematurely?

240

11 Apr 2024

Exploring the Mystery of Influential Data for Mathematical Reasoning

Yujiu Yang

241

01 Apr 2024

Rejection Improves Reliability: Training LLMs to Refuse Unknown Questions Using RL from Knowledge Feedback

Hongshen Xu

Kai Yu

335

27 Mar 2024

COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning

...

Min Yang

Ge Zhang

160

26 Mar 2024

LLM2LLM: Boosting LLMs with Novel Iterative Data EnhancementAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

Nicholas Lee

Thanakul Wattanawong

Sehoon Kim

K. Mangalam

Sheng Shen

Gopala Anumanchipalli

Michael W. Mahoney

Kurt Keutzer

A. Gholami

306

22 Mar 2024

Improving the Robustness of Large Language Models via Consistency Alignment

221

21 Mar 2024

SmallToLarge (S2L): Scalable Data Selection for Fine-tuning Large Language Models by Summarizing Training Trajectories of Small ModelsNeural Information Processing Systems (NeurIPS), 2024

Yu Yang

Siddhartha Mishra

Jeffrey N Chiang

Baharan Mirzasoleiman

324

12 Mar 2024

Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters

Linjie Yang

Heng Wang

189

05 Mar 2024

AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning

...

Silvio Savarese

Huan Wang

358

23 Feb 2024

A Survey on Knowledge Distillation of Large Language Models

469

238

20 Feb 2024

Your Vision-Language Model Itself Is a Strong Filter: Towards High-Quality Instruction Tuning with Data Selection

198

19 Feb 2024

Revisiting Knowledge Distillation for Autoregressive Language Models

Qihuang Zhong

Liang Ding

Li Shen

Juhua Liu

Bo Du

Dacheng Tao

KELM

312

19 Feb 2024

ROSE Doesn't Do That: Boosting the Safety of Instruction-Tuned Large Language Models with Reverse Prompt Contrastive Decoding

Liang Ding

Bo Du

270

19 Feb 2024

KnowTuning: Knowledge-aware Fine-tuning for Large Language Models

Maarten de Rijke

246

17 Feb 2024

Selective Reflection-Tuning: Student-Selected Data Recycling for LLM Instruction-Tuning

441

15 Feb 2024

API Pack: A Massive Multi-Programming Language Dataset for API Call Generation

423

14 Feb 2024

Towards Faithful and Robust LLM Specialists for Evidence-Based Question-Answering

Mathias Kraus

242

13 Feb 2024

Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

...

Niklas Muennighoff

246

328

12 Feb 2024

Step-On-Feet Tuning: Scaling Self-Alignment of LLMs via Bootstrapping

Haoyu Wang

Guozheng Ma

Ziqiao Meng

Zeyu Qin

Li Shen

...

275

12 Feb 2024

Long Is More for Alignment: A Simple but Tough-to-Beat Baseline for Instruction Fine-Tuning

Hao Zhao

Maksym Andriushchenko

Francesco Croce

Nicolas Flammarion

ALM

338

07 Feb 2024

LESS: Selecting Influential Data for Targeted Instruction Tuning

587

384

06 Feb 2024