Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2307.08701
Cited By

AlpaGasus: Training A Better Alpaca with Fewer Data

v1v2v3v4v5 (latest)

AlpaGasus: Training A Better Alpaca with Fewer Data

17 July 2023

Kalpa Gunaratna

Vikas Yadav

Vijay Srinivasan

Heng-Chiao Huang

ArXiv (abs)PDF HTML HuggingFace (23 upvotes)

Papers citing "AlpaGasus: Training A Better Alpaca with Fewer Data"

50 / 189 papers shown

Select2Reason: Efficient Instruction-Tuning Data Selection for Long-CoT Reasoning

Select2Reason: Efficient Instruction-Tuning Data Selection for Long-CoT Reasoning

351

3

0

24 Dec 2025

Towards Active Synthetic Data Generation for Finetuning Language Models

Towards Active Synthetic Data Generation for Finetuning Language Models

Daniel Madrigal Diaz

Saravan Rajmohan

284

0

0

30 Nov 2025

SmolKalam: Ensemble Quality-Filtered Translation at Scale for High Quality Arabic Post-Training Data

SmolKalam: Ensemble Quality-Filtered Translation at Scale for High Quality Arabic Post-Training Data

Sultan AlRashed

Francesco Orabona

119

0

0

23 Nov 2025

Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting

Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting

149

0

0

17 Nov 2025

PrAda-GAN: A Private Adaptive Generative Adversarial Network with Bayes Network Structure

PrAda-GAN: A Private Adaptive Generative Adversarial Network with Bayes Network Structure

140

0

0

11 Nov 2025

Selecting Auxiliary Data via Neural Tangent Kernels for Low-Resource Domains

Selecting Auxiliary Data via Neural Tangent Kernels for Low-Resource Domains

158

2

0

10 Nov 2025

LM-mixup: Text Data Augmentation via Language Model based Mixup

LM-mixup: Text Data Augmentation via Language Model based Mixup

121

0

0

23 Oct 2025

See the Text: From Tokenization to Visual Reading

See the Text: From Tokenization to Visual Reading

Alex Jinpeng Wang

167

4

0

21 Oct 2025

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

ssToken: Self-modulated and Semantic-aware Token Selection for LLM Fine-tuning

Xiangdong Zhang

170

2

0

21 Oct 2025

Computational Budget Should Be Considered in Data Selection

Computational Budget Should Be Considered in Data Selection

245

0

0

19 Oct 2025

Utility-Diversity Aware Online Batch Selection for LLM Supervised Fine-tuning

Utility-Diversity Aware Online Batch Selection for LLM Supervised Fine-tuning

212

2

0

19 Oct 2025

Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning

Holdout-Loss-Based Data Selection for LLM Finetuning via In-Context Learning

Park Cheonyoung

Jiang Bian

137

0

0

16 Oct 2025

Towards Understanding Valuable Preference Data for Large Language Model Alignment

Towards Understanding Valuable Preference Data for Large Language Model Alignment

Masashi Sugiyama

124

2

0

15 Oct 2025

The Harder The Better: Maintaining Supervised Fine-tuning Generalization with Less but Harder Data

The Harder The Better: Maintaining Supervised Fine-tuning Generalization with Less but Harder Data

100

0

0

14 Oct 2025

Evolution of meta's llama models and parameter-efficient fine-tuning of large language models: a survey

Evolution of meta's llama models and parameter-efficient fine-tuning of large language models: a survey

Abdulhady Abas Abdullah

Arkaitz Zubiaga

Seyedali Mirjalili

Fatemeh Daneshfar

Mohammadsadra Amini

Alan Salam Mohammed

211

2

0

14 Oct 2025

CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization

CoIDO: Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization

143

3

0

11 Oct 2025

TiTok: Transfer Token-level Knowledge via Contrastive Excess to Transplant LoRA

TiTok: Transfer Token-level Knowledge via Contrastive Excess to Transplant LoRA

187

0

0

06 Oct 2025

Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning

Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning

265

2

0

05 Oct 2025

Increasing LLM response trustworthiness using voting ensembles

Increasing LLM response trustworthiness using voting ensembles

Aparna Nair-Kanneganti

Shir Goldfinger

Alison M. Pouch

161

0

0

05 Oct 2025

Data Selection for Fine-tuning Vision Language Models via Cross Modal Alignment Trajectories

Data Selection for Fine-tuning Vision Language Models via Cross Modal Alignment Trajectories

Baharan Mirzasoleiman

117

1

0

01 Oct 2025

Large-Scale Constraint Generation - Can LLMs Parse Hundreds of Constraints?

Large-Scale Constraint Generation - Can LLMs Parse Hundreds of Constraints?

198

0

0

28 Sep 2025

Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning

...

Linfeng Zhang

174

6

0

28 Sep 2025

Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment

Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment

226

2

0

28 Sep 2025

TsqLoRA: Towards Sensitivity and Quality Low-Rank Adaptation for Efficient Fine-Tuning

TsqLoRA: Towards Sensitivity and Quality Low-Rank Adaptation for Efficient Fine-Tuning

186

0

0

23 Sep 2025

A method for improving multilingual quality and diversity of instruction fine-tuning datasets

A method for improving multilingual quality and diversity of instruction fine-tuning datasets

...

163

0

0

19 Sep 2025

Generating High-Quality Datasets for Code Editing via Open-Source Language Models

Generating High-Quality Datasets for Code Editing via Open-Source Language Models

220

0

0

19 Sep 2025

Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum Learning

Teaching According to Talents! Instruction Tuning LLMs with Competence-Aware Curriculum LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2025

Wei-Chieh Huang

267

1

0

17 Sep 2025

DaMoC: Efficiently Selecting the Optimal Large Language Model for Fine-tuning Domain Tasks Based on Data and Model Compression

DaMoC: Efficiently Selecting the Optimal Large Language Model for Fine-tuning Domain Tasks Based on Data and Model Compression

247

0

0

01 Sep 2025

Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning

Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning

350

2

0

29 Aug 2025

Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation

Hierarchical Fine-grained Preference Optimization for Physically Plausible Video Generation

Harold Haodong Chen

149

12

0

14 Aug 2025

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

CoT-Self-Instruct: Building high-quality synthetic prompts for reasoning and non-reasoning tasks

Jack Lanchantin

O. Yu. Golovneva

Sainbayar Sukhbaatar

322

16

0

31 Jul 2025

Trust the Model: Compact VLMs as In-Context Judges for Image-Text Data Quality

Trust the Model: Compact VLMs as In-Context Judges for Image-Text Data Quality

Daulet Toibazar

Abdulaziz Al-Badawi

Abdulrahman Alfulayt

Pedro J. Moreno

283

0

0

27 Jul 2025

RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models

RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models

474

3

0

23 Jun 2025

FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE

FLAME: Towards Federated Fine-Tuning Large Language Models Through Adaptive SMoE

279

0

0

19 Jun 2025

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

399

2

0

08 Jun 2025

Large Language Models are Demonstration Pre-Selectors for Themselves

Large Language Models are Demonstration Pre-Selectors for Themselves

299

2

0

06 Jun 2025

Understanding the Impact of Sampling Quality in Direct Preference Optimization

Understanding the Impact of Sampling Quality in Direct Preference Optimization

334

0

0

03 Jun 2025

T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning

T-SHIRT: Token-Selective Hierarchical Data Selection for Instruction Tuning

Sanghamitra Dutta

423

7

0

02 Jun 2025

Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning

Resolving Knowledge Conflicts in Domain-specific Data Selection: A Case Study on Medical Instruction-tuning

318

0

0

28 May 2025

Efficient Data Selection at Scale via Influence Distillation

Efficient Data Selection at Scale via Influence Distillation

Vincent Cohen-Addad

401

8

0

25 May 2025

Not All Documents Are What You Need for Extracting Instruction Tuning Data

Not All Documents Are What You Need for Extracting Instruction Tuning Data

Chengliang Chai

...

282

0

0

18 May 2025

Large Language Models for Computer-Aided Design: A Survey

Large Language Models for Computer-Aided Design: A Survey

412

12

0

13 May 2025

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

...

Shuaiqiang Wang

Simon Shaolei Du

919

200

0

29 Apr 2025

Data-efficient LLM Fine-tuning for Code Generation

Data-efficient LLM Fine-tuning for Code Generation

Sheng-Jun Huang

182

4

0

17 Apr 2025

SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement

SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement

Chung-Ching Lin

Kevin Qinghong Lin

OODD ReLM LRM VLM

645

97

0

10 Apr 2025

Adversarial Training of Reward Models

Adversarial Training of Reward Models

Alexander Bukharin

Adithya Renduchintala

Oleksii Kuchaiev

Olivier Delalleau

462

8

0

08 Apr 2025

CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment

CONGRAD:Conflicting Gradient Filtering for Multilingual Preference Alignment

Christian Herold

Amirhossein Tebbifakhr

Shahram Khadivi

Gholamreza Haffari

487

0

0

31 Mar 2025

MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning

MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning

625

8

0

26 Mar 2025

Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm

Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm

406

6

0

04 Mar 2025

Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART)

Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART)

438

1

0

03 Mar 2025

Page 1 of 4