v1v2v3v4 (latest)

Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning

29 November 2024

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)Github (51★)

Papers citing "Initialization using Update Approximation is a Silver Bullet for Extremely Efficient Low-Rank Fine-Tuning"

44 / 44 papers shown

Title
Beyond Higher Rank: Token-wise Input-Output Projections for Efficient Low-Rank Adaptation Shiwei Li Xiandi Luo Haozhao Wang Xing Tang Ziqiang Cui Dugang Liu Yuhua Li Xiuqiang He Ruixuan Li 76 1 0 27 Oct 2025
Find Your Optimal Teacher: Personalized Data Synthesis via Router-Guided Multi-Teacher Distillation Hengyuan Zhang Shiping Yang Xiao Liang Chenming Shang Yuxuan Jiang ... Jing Xiong Hayden Kwok-Hay So Ruobing Xie Angel X. Chang Ngai Wong 116 0 0 13 Oct 2025
PoLAR: Polar-Decomposed Low-Rank Adapter Representation Kai Lion Liang Zhang Bingcong Li Niao He 188 3 0 03 Jun 2025
Beyond Zero Initialization: Investigating the Impact of Non-Zero Initialization on LoRA Fine-Tuning Dynamics Shiwei Li Xiandi Luo Xing Tang Haozhao Wang Hao Chen Weihong Luo Yuhua Li Xiuqiang He Ruixuan Li AI4CE 165 6 0 29 May 2025
LoFT: Low-Rank Adaptation That Behaves Like Full Fine-Tuning Nurbek Tastan Stefanos Laskaridis Martin Takáč Karthik Nandakumar Samuel Horváth AI4CE 180 4 0 27 May 2025
ABBA-Adapters: Efficient and Expressive Fine-Tuning of Foundation Models Raghav Singhal Kaustubh Ponkshe Rohit Vartak Praneeth Vepakomma 465 1 0 20 May 2025
AltLoRA: Towards Better Gradient Approximation in Low-Rank Adaptation with Alternating Projections Xin Yu Yujia Wang Jinghui Chen Lingzhou Xue 243 2 0 18 May 2025
Fed-SB: A Silver Bullet for Extreme Communication Efficiency and Performance in (Private) Federated LoRA Fine-Tuning Raghav Singhal Kaustubh Ponkshe Rohit Vartak Lav R. Varshney Praneeth Vepakomma FedML 225 7 0 21 Feb 2025
Gemma 2: Improving Open Language Models at a Practical Size Gemma Team Gemma Team Morgane Riviere Shreya Pathak Pier Giuseppe Sessa Cassidy Hardin ... Noah Fiedel Armand Joulin Kathleen Kenealy Robert Dadashi Alek Andreev VLM MoE OSLM 461 1,468 0 31 Jul 2024
LoRA-Pro: Are Low-Rank Adapters Properly Optimized? Zhengbo Wang Jian Liang Ran He Zilei Wang Tieniu Tan 387 45 0 25 Jul 2024
LoRA-GA: Low-Rank Adaptation with Gradient Approximation Shaowen Wang Linxi Yu Jian Li ALM AI4CE 324 81 0 06 Jul 2024
LoRA-XS: Low-Rank Adaptation with Extremely Small Number of Parameters Klaudia Bałazy Mohammadreza Banaei Karl Aberer Jacek Tabor 251 50 0 27 May 2024
HydraLoRA: An Asymmetric LoRA Architecture for Efficient Fine-Tuning Chunlin Tian Zhanying Shi Zhijiang Guo Li Li Chengzhong Xu 147 93 0 30 Apr 2024
Improving LoRA in Privacy-preserving Federated LearningInternational Conference on Learning Representations (ICLR), 2024 Youbang Sun Zitao Li Yaliang Li Bolin Ding 303 119 0 18 Mar 2024
GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection Jiawei Zhao Zhenyu Zhang Beidi Chen Zinan Lin A. Anandkumar Yuandong Tian 329 322 0 06 Mar 2024
A Rank Stabilization Scaling Factor for Fine-Tuning with LoRA Damjan Kalajdzievski ALM 202 159 0 28 Nov 2023
Tied-Lora: Enhancing parameter efficiency of LoRA with weight tying Adithya Renduchintala Tugrul Konuk Oleksii Kuchaiev MoMe 268 64 0 16 Nov 2023
MetaMath: Bootstrap Your Own Mathematical Questions for Large Language ModelsInternational Conference on Learning Representations (ICLR), 2023 L. Yu Weisen Jiang Han Shi Jincheng Yu Zhengying Liu Yu Zhang James T. Kwok Zheng Li Adrian Weller Weiyang Liu OSLM LRM 412 533 0 21 Sep 2023
ReLoRA: High-Rank Training Through Low-Rank UpdatesInternational Conference on Learning Representations (ICLR), 2023 Vladislav Lialin Namrata Shivagunde Sherin Muckatira Anna Rumshisky BDL 383 170 0 11 Jul 2023
Full Parameter Fine-tuning for Large Language Models with Limited ResourcesAnnual Meeting of the Association for Computational Linguistics (ACL), 2023 Kai Lv Yuqing Yang Tengxiao Liu Qi-jie Gao Qipeng Guo Xipeng Qiu 272 179 0 16 Jun 2023
QLoRA: Efficient Finetuning of Quantized LLMsNeural Information Processing Systems (NeurIPS), 2023 Tim Dettmers Artidoro Pagnoni Ari Holtzman Luke Zettlemoyer ALM 455 3,509 0 23 May 2023
Segment AnythingIEEE International Conference on Computer Vision (ICCV), 2023 A. Kirillov Eric Mintun Nikhila Ravi Hanzi Mao Chloe Rolland ... Spencer Whitehead Alexander C. Berg Wan-Yen Lo Piotr Dollár Ross B. Girshick MLLM VLM 790 10,568 0 05 Apr 2023
LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Zhiqiang Hu Lei Wang Yihuai Lan Wanyu Xu Ee-Peng Lim Lidong Bing Xing Xu Soujanya Poria Roy Ka-wei Lee ALM 259 370 0 04 Apr 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 3.4K 20,007 0 15 Mar 2023
Language Models are General-Purpose Interfaces Y. Hao Haoyu Song Li Dong Shaohan Huang Zewen Chi Wenhui Wang Shuming Ma Furu Wei MLLM 167 107 0 13 Jun 2022
Few-Shot Parameter-Efficient Fine-Tuning is Better and Cheaper than In-Context LearningNeural Information Processing Systems (NeurIPS), 2022 Haokun Liu Derek Tam Mohammed Muqeeth Jay Mohta Tenghao Huang Joey Tianyi Zhou Colin Raffel 373 1,126 0 11 May 2022
Training Verifiers to Solve Math Word Problems K. Cobbe V. Kosaraju Mohammad Bavarian Mark Chen Heewoo Jun ... Jerry Tworek Jacob Hilton Reiichiro Nakano Christopher Hesse John Schulman ReLM OffRL LRM 952 6,512 0 27 Oct 2021
The Power of Scale for Parameter-Efficient Prompt TuningConference on Empirical Methods in Natural Language Processing (EMNLP), 2021 Brian Lester Rami Al-Rfou Noah Constant VPVLM 1.3K 4,831 0 18 Apr 2021
Measuring Mathematical Problem Solving With the MATH Dataset Dan Hendrycks Collin Burns Saurav Kadavath Akul Arora Steven Basart Eric Tang Basel Alomair Jacob Steinhardt ReLM FaML 739 3,710 0 05 Mar 2021
Learning Transferable Visual Models From Natural Language SupervisionInternational Conference on Machine Learning (ICML), 2021 Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 1.9K 39,712 0 26 Feb 2021
Prefix-Tuning: Optimizing Continuous Prompts for GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2021 Xiang Lisa Li Abigail Z. Jacobs 597 5,089 0 01 Jan 2021
Language Models are Few-Shot LearnersNeural Information Processing Systems (NeurIPS), 2020 Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 1.9K 51,003 0 28 May 2020
AdapterFusion: Non-Destructive Task Composition for Transfer LearningConference of the European Chapter of the Association for Computational Linguistics (EACL), 2020 Jonas Pfeiffer Aishwarya Kamath Andreas Rucklé Dong Wang Iryna Gurevych CLL MoMe 724 1,002 0 01 May 2020
PyTorch: An Imperative Style, High-Performance Deep Learning LibraryNeural Information Processing Systems (NeurIPS), 2019 Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury ... Sasank Chilamkurthy Benoit Steiner Lu Fang Junjie Bai Soumith Chintala ODL 932 47,917 0 03 Dec 2019
PIQA: Reasoning about Physical Commonsense in Natural LanguageAAAI Conference on Artificial Intelligence (AAAI), 2019 Yonatan Bisk Rowan Zellers Ronan Le Bras Jianfeng Gao Yejin Choi OOD LRM 1.1K 2,415 0 26 Nov 2019
RoBERTa: A Robustly Optimized BERT Pretraining Approach Yinhan Liu Myle Ott Naman Goyal Jingfei Du Mandar Joshi Danqi Chen Omer Levy M. Lewis Luke Zettlemoyer Veselin Stoyanov AIMat 2.1K 27,431 0 26 Jul 2019
BoolQ: Exploring the Surprising Difficulty of Natural Yes/No QuestionsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2019 Christopher Clark Kenton Lee Ming-Wei Chang Tom Kwiatkowski Michael Collins Kristina Toutanova 607 1,975 0 24 May 2019
HellaSwag: Can a Machine Really Finish Your Sentence?Annual Meeting of the Association for Computational Linguistics (ACL), 2019 Rowan Zellers Ari Holtzman Yonatan Bisk Ali Farhadi Yejin Choi 501 3,336 0 19 May 2019
Can a Suit of Armor Conduct Electricity? A New Dataset for Open Book Question Answering Todor Mihaylov Peter Clark Tushar Khot Ashish Sabharwal 514 1,978 0 08 Sep 2018
Know What You Don't Know: Unanswerable Questions for SQuAD Pranav Rajpurkar Robin Jia Abigail Z. Jacobs RALM ELM 721 3,098 0 11 Jun 2018
Neural Network Acceptability Judgments Alex Warstadt Amanpreet Singh Samuel R. Bowman 474 1,520 0 31 May 2018
Think you have Solved Question Answering? Try ARC, the AI2 Reasoning Challenge Peter Clark Isaac Cowhey Oren Etzioni Tushar Khot Ashish Sabharwal Carissa Schoenick Oyvind Tafjord ELM RALM LRM 876 3,593 0 14 Mar 2018
SemEval-2017 Task 1: Semantic Textual Similarity - Multilingual and Cross-lingual Focused Evaluation Daniel Cer Mona T. Diab Eneko Agirre I. Lopez-Gazpio Lucia Specia 732 2,002 0 31 Jul 2017
Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification Kaiming He Xinming Zhang Shaoqing Ren Jian Sun VLM 846 19,732 0 06 Feb 2015