Get more for less: Principled Data Selection for Warming Up Fine-Tuning
in LLMs

Get more for less: Principled Data Selection for Warming Up Fine-Tuning in LLMs

5 May 2024

Himanshu Jahagirdar

Anit Kumar Sahu

Papers citing "Get more for less: Principled Data Selection for Warming Up Fine-Tuning in LLMs"

12 / 12 papers shown

Title
The Best Instruction-Tuning Data are Those That Fit Dylan Zhang Qirun Dai Hao Peng ALM 111 3 0 06 Feb 2025
Mitigating Forgetting in LLM Supervised Fine-Tuning and Preference Learning H. Fernando Han Shen Parikshit Ram Yi Zhou Horst Samulowitz Nathalie Baracaldo Tianyi Chen CLL 47 2 0 20 Oct 2024
RoVRM: A Robust Visual Reward Model Optimized via Auxiliary Textual Preference Data Chenglong Wang Yang Gan Yifu Huo Yongyu Mu Murun Yang ... Chunliang Zhang Tongran Liu Quan Du Di Yang Jingbo Zhu VLM 48 4 0 22 Aug 2024
RegMix: Data Mixture as Regression for Language Model Pre-training Qian Liu Xiaosen Zheng Niklas Muennighoff Guangtao Zeng Longxu Dou Tianyu Pang Jing Jiang Min-Bin Lin MoE 40 34 1 01 Jul 2024
Data Selection for Fine-tuning Large Language Models Using Transferred Shapley Values S. Schoch Ritwick Mishra Yangfeng Ji TDI 66 18 0 16 Jun 2023
Sparks of Artificial General Intelligence: Early experiments with GPT-4 Sébastien Bubeck Varun Chandrasekaran Ronen Eldan J. Gehrke Eric Horvitz ... Scott M. Lundberg Harsha Nori Hamid Palangi Marco Tulio Ribeiro Yi Zhang ELM AI4MH AI4CE ALM 197 2,953 0 22 Mar 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Optimal Transport Tools (OTT): A JAX Toolbox for all things Wasserstein Marco Cuturi Laetitia Meng-Papaxanthos Yingtao Tian Charlotte Bunne Geoff Davis O. Teboul OT 137 71 0 28 Jan 2022
GRAD-MATCH: Gradient Matching based Data Subset Selection for Efficient Deep Model Training Krishnateja Killamsetty D. Sivasubramanian Ganesh Ramakrishnan A. De Rishabh K. Iyer OOD 75 184 0 27 Feb 2021
The Pile: An 800GB Dataset of Diverse Text for Language Modeling Leo Gao Stella Biderman Sid Black Laurence Golding Travis Hoppe ... Horace He Anish Thite Noa Nabeshima Shawn Presser Connor Leahy AIMat 236 1,508 0 31 Dec 2020
On Unbalanced Optimal Transport: An Analysis of Sinkhorn Algorithm Khiem Pham Khang Le Nhat Ho Tung Pham Hung Bui OT 25 72 0 09 Feb 2020
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,927 0 20 Apr 2018