Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2307.08701
Cited By

AlpaGasus: Training A Better Alpaca with Fewer Data

v1v2v3v4v5 (latest)

AlpaGasus: Training A Better Alpaca with Fewer Data

17 July 2023

Kalpa Gunaratna

Vikas Yadav

Vijay Srinivasan

Heng-Chiao Huang

ArXiv (abs)PDF HTML HuggingFace (23 upvotes)

Papers citing "AlpaGasus: Training A Better Alpaca with Fewer Data"

50 / 189 papers shown

Select2Reason: Efficient Instruction-Tuning Data Selection for Long-CoT Reasoning

Select2Reason: Efficient Instruction-Tuning Data Selection for Long-CoT Reasoning

307

3

0

24 Dec 2025

Towards Active Synthetic Data Generation for Finetuning Language Models

Daniel Madrigal Diaz

Saravan Rajmohan

182

0

0

30 Nov 2025

SmolKalam: Ensemble Quality-Filtered Translation at Scale for High Quality Arabic Post-Training Data

SmolKalam: Ensemble Quality-Filtered Translation at Scale for High Quality Arabic Post-Training Data

Sultan AlRashed

Francesco Orabona

108

0

0

23 Nov 2025

Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting

Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting

118

0

0

17 Nov 2025

PrAda-GAN: A Private Adaptive Generative Adversarial Network with Bayes Network Structure

PrAda-GAN: A Private Adaptive Generative Adversarial Network with Bayes Network Structure

124

2

0

11 Nov 2025

Selecting Auxiliary Data via Neural Tangent Kernels for Low-Resource Domains

Selecting Auxiliary Data via Neural Tangent Kernels for Low-Resource Domains

129

1

0

10 Nov 2025

LM-mixup: Text Data Augmentation via Language Model based Mixup

LM-mixup: Text Data Augmentation via Language Model based Mixup

100

0

0

23 Oct 2025

See the Text: From Tokenization to Visual Reading

See the Text: From Tokenization to Visual Reading

Alex Jinpeng Wang

159

1

0

21 Oct 2025

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

Xiangdong Zhang

145

1

0

21 Oct 2025

Computational Budget Should Be Considered in Data Selection

Computational Budget Should Be Considered in Data Selection

205

0

0

19 Oct 2025

Utility-Diversity Aware Online Batch Selection for LLM Supervised Fine-tuning

Utility-Diversity Aware Online Batch Selection for LLM Supervised Fine-tuning

178

1

0

19 Oct 2025

Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning

Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning

Park Cheonyoung

75

0

0

16 Oct 2025

Towards Understanding Valuable Preference Data for Large Language Model Alignment

Towards Understanding Valuable Preference Data for Large Language Model Alignment

Masashi Sugiyama

112

0

0

15 Oct 2025

The Harder The Better: Maintaining Supervised Fine-tuning Generalization with Less but Harder Data

The Harder The Better: Maintaining Supervised Fine-tuning Generalization with Less but Harder Data

81

0

0

14 Oct 2025

Evolution of meta's llama models and parameter-efficient fine-tuning of large language models: a survey

Evolution of meta's llama models and parameter-efficient fine-tuning of large language models: a survey

Abdulhady Abas Abdullah

Arkaitz Zubiaga

Seyedali Mirjalili

Fatemeh Daneshfar

Mohammadsadra Amini

Alan Salam Mohammed

193

0

0

14 Oct 2025

CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization

CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization

119

0

0

11 Oct 2025

TiTok: Transfer Token-level Knowledge via Contrastive Excess to Transplant LoRA

TiTok: Transfer Token-level Knowledge via Contrastive Excess to Transplant LoRA

151

0

0

06 Oct 2025

Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning

Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning

244

1

0

05 Oct 2025

Increasing LLM response trustworthiness using voting ensembles

Increasing LLM response trustworthiness using voting ensembles

Aparna Nair-Kanneganti

Shir Goldfinger

Alison M. Pouch

142

0

0

05 Oct 2025

Data Selection for Fine-tuning Vision Language Models via Cross Modal Alignment Trajectories

Data Selection for Fine-tuning Vision Language Models via Cross Modal Alignment Trajectories

Baharan Mirzasoleiman

104

0

0

01 Oct 2025

Large-Scale Constraint Generation - Can LLMs Parse Hundreds of Constraints?

Large-Scale Constraint Generation - Can LLMs Parse Hundreds of Constraints?

179

0

0

28 Sep 2025

Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

...

147

5

0

28 Sep 2025

Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment

Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment

191

1

0

28 Sep 2025

TsqLoRA: Towards Sensitivity and Quality Low-Rank Adaptation for Efficient Fine-Tuning

TsqLoRA: Towards Sensitivity and Quality Low-Rank Adaptation for Efficient Fine-Tuning

168

0

0

23 Sep 2025

A method for improving multilingual quality and diversity of instruction fine-tuning datasets

A method for improving multilingual quality and diversity of instruction fine-tuning datasets

...

109

0

0

19 Sep 2025

Generating High-Quality Datasets for Code Editing via Open-Source Language Models

Generating High-Quality Datasets for Code Editing via Open-Source Language Models

201

0

0

19 Sep 2025

Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum Learning

Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2025

Wei-Chieh Huang

234

0

0

17 Sep 2025

DaMoC: Efficiently Selecting the Optimal Large Language Model for Fine-tuning Domain Tasks Based on Data and Model Compression

DaMoC: Efficiently Selecting the Optimal Large Language Model for Fine-tuning Domain Tasks Based on Data and Model Compression

213

0

0

01 Sep 2025

Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning

Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning

324

2

0

29 Aug 2025

Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation

Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation

Harold Haodong Chen

125

10

0

14 Aug 2025

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Jack Lanchantin

O. Yu. Golovneva

Sainbayar Sukhbaatar

286

12

0

31 Jul 2025

Trust the Model: Compact VLMs as In-Context Judges for Image-Text Data Quality

Trust the Model: Compact VLMs as In-Context Judges for Image-Text Data Quality

Daulet Toibazar

Abdulaziz Al-Badawi

Abdulrahman Alfulayt

Pedro J. Moreno

194

0

0

27 Jul 2025

RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models

RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models

403

1

0

23 Jun 2025

FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE

FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE

270

0

0

19 Jun 2025

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

335

1

0

08 Jun 2025

Large Language Models are Demonstration Pre-Selectors for Themselves

Large Language Models are Demonstration Pre-Selectors for Themselves

282

2

0

06 Jun 2025

Understanding the Impact of Sampling Quality in Direct Preference Optimization

Understanding the Impact of Sampling Quality in Direct Preference Optimization

276

0

0

03 Jun 2025

T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning

T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning

Sanghamitra Dutta

343

6

0

02 Jun 2025

Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning

Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning

242

0

0

28 May 2025

Efficient Data Selection at Scale via Influence Distillation

Efficient Data Selection at Scale via Influence Distillation

Vincent Cohen-Addad

329

4

0

25 May 2025

Not All Documents Are What You Need for Extracting Instruction Tuning Data

Not All Documents Are What You Need for Extracting Instruction Tuning Data

Chengliang Chai

...

236

0

0

18 May 2025

Large Language Models for Computer-Aided Design: A Survey

Large Language Models for Computer-Aided Design: A Survey

390

9

0

13 May 2025

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

...

Shuaiqiang Wang

Simon Shaolei Du

812

160

0

29 Apr 2025

Data-efficient LLM Fine-tuning for Code Generation

Data-efficient LLM Fine-tuning for Code Generation

Sheng-Jun Huang

176

4

0

17 Apr 2025

SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement

SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement

Chung-Ching Lin

Kevin Qinghong Lin

OODD ReLM LRM VLM

591

73

0

10 Apr 2025

Adversarial Training of Reward Models

Adversarial Training of Reward Models

Alexander Bukharin

Adithya Renduchintala

Oleksii Kuchaiev

Olivier Delalleau

438

6

0

08 Apr 2025

CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment

CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment

Christian Herold

Amirhossein Tebbifakhr

Shahram Khadivi

Gholamreza Haffari

444

0

0

31 Mar 2025

MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning

MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning

501

6

0

26 Mar 2025

Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm

Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm

325

5

0

04 Mar 2025

Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART)

Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART)

417

1

0

03 Mar 2025