v1v2v3 (latest)

Fine-Tuning Language Models with Just Forward Passes

Neural Information Processing Systems (NeurIPS), 2023

27 May 2023

ArXiv (abs)PDF HTML HuggingFace (3 upvotes)

Papers citing "Fine-Tuning Language Models with Just Forward Passes"

50 / 188 papers shown

Towards Efficient Large Language Models for Scientific Text: A Review

H. To

Ming Liu

Guangyan Huang

184

20 Aug 2024

Fine-Tuning and Deploying Large Language Models Over Edges: Issues and Approaches

258

20 Aug 2024

Parameter-Efficient Fine-Tuning via Circular Convolution

503

27 Jul 2024

Improving GPU Multi-Tenancy Through Dynamic Multi-Instance GPU Reconfiguration

232

18 Jul 2024

Online Pseudo-Zeroth-Order Training of Neuromorphic Spiking Neural Networks

271

17 Jul 2024

MINI-LLM: Memory-Efficient Structured Pruning for Large Language Models

Hongrong Cheng

Miao Zhang

J. Q. Shi

297

16 Jul 2024

LoRA-PT: Low-Rank Adapting UNETR for Hippocampus Segmentation Using Principal Tensor Singular Values and Vectors

351

16 Jul 2024

Mobile Edge Intelligence for Large Language Models: A Contemporary Survey

Guanqiao Qu

Qiyuan Chen

Wei Wei

Zheng Lin

Xianhao Chen

Kaibin Huang

544

157

09 Jul 2024

Expressive and Generalizable Low-rank Adaptation for Large Models via Slow Cascaded Learning

Siwei Li

Yifan Yang

Yifei Shen

Fangyun Wei

Zongqing Lu

L. Qiu

Yuqing Yang

AI4CE

208

01 Jul 2024

PocketLLM: Enabling On-Device Fine-Tuning for Personalized LLMs

Dan Peng

Zhihui Fu

Jun Wang

199

01 Jul 2024

Efficient Expert Pruning for Sparse Mixture-of-Experts Language Models: Enhancing Performance and Reducing Inference Costs

Enshu Liu

Huazhong Yang

Yu Wang

MoE

233

01 Jul 2024

AdaZeta: Adaptive Zeroth-Order Tensor-Train Adaption for Memory-Efficient Large Language Models Fine-Tuning

Yifan Yang

Kai Zhen

Ershad Banijamal

Athanasios Mouchtaris

Zheng Zhang

139

26 Jun 2024

Adam-mini: Use Fewer Learning Rates To Gain More

Zhi-Quan Luo

450

24 Jun 2024

Rethinking Pruning Large Language Models: Benefits and Pitfalls of Reconstruction Error Minimization

180

21 Jun 2024

Communication-Efficient Byzantine-Resilient Federated Zero-Order Optimization

Afonso de Sá Delgado Neto

134

20 Jun 2024

Memory-Efficient Gradient Unrolling for Large-Scale Bi-level Optimization

Qianli Shen

Yezhen Wang

Zhouhao Yang

241

20 Jun 2024

Synergizing Foundation Models and Federated Learning: A Survey

Meng Fang

Edith C. -H. Ngai

266

18 Jun 2024

DIEKAE: Difference Injection for Efficient Knowledge Augmentation and Editing of Large Language Models

Alessio Galatolo

Meriem Beloucif

Katie Winkle

163

15 Jun 2024

Minimizing Energy Costs in Deep Learning Model Training: The Gaussian Sampling Approach

Challapalli Phanindra Revanth

Sumohana S. Channappayya

C Krishna Mohan

208

11 Jun 2024

Zeroth-Order Fine-Tuning of LLMs with Extreme Sparsity

...

Zhaozhuo Xu

267

05 Jun 2024

Why Larger Language Models Do In-context Learning Differently?

268

30 May 2024

Double Variance Reduction: A Smoothing Trick for Composite Optimization Problems without First-Order Gradient

Guang Dai

Ivor W. Tsang

348

28 May 2024

Understanding Linear Probing then Fine-tuning Language Models from NTK Perspective

Akiyoshi Tomihari

Issei Sato

281

27 May 2024

Thinking Forward: Memory-Efficient Federated Finetuning of Language Models

225

24 May 2024

Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization

533

24 May 2024

Efficient Multimodal Large Language Models: A Survey

Yizhang Jin

Jian Li

Yexin Liu

Tianjun Gu

Kai Wu

...

Xin Tan

Zhenye Gan

Yabiao Wang

Chengjie Wang

Lizhuang Ma

LRM

307

17 May 2024

Binary Hypothesis Testing for Softmax Models and Leverage Score Models

Yeqi Gao

Yuzhou Gu

Zhao Song

413

09 May 2024

Random Masking Finds Winning Tickets for Parameter Efficient Fine-tuningInternational Conference on Machine Learning (ICML), 2024

Jing Xu

Jingzhao Zhang

232

04 May 2024

BAdam: A Memory Efficient Full Parameter Optimization Method for Large Language ModelsNeural Information Processing Systems (NeurIPS), 2024

Qi Luo

Hengxu Yu

Xiao Li

264

03 Apr 2024

Test-Time Model Adaptation with Only Forward PassesInternational Conference on Machine Learning (ICML), 2024

407

02 Apr 2024

Linear Combination of Saved Checkpoints Makes Consistency and Diffusion Models BetterInternational Conference on Learning Representations (ICLR), 2024

Shuaiqi Wang

...

Sergey Yekhanin

433

02 Apr 2024

Heterogeneous Contrastive Learning for Foundation Models and Beyond

241

30 Mar 2024

LISA: Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning

Tong Zhang

384

26 Mar 2024

Parameter-Efficient Fine-Tuning for Large Models: A Comprehensive Survey

803

715

21 Mar 2024

Debiased Noise Editing on Foundation Models for Fair Medical Image ClassificationInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2024

393

10 Mar 2024

Privacy-preserving Fine-tuning of Large Language Models through Flatness

238

07 Mar 2024

Differentially Private Synthetic Data via Foundation Model APIs 2: Text

Chulin Xie

...

249

04 Mar 2024

OSSCAR: One-Shot Structured Pruning in Vision and Language Models with Combinatorial Optimization

340

02 Mar 2024

A Survey of Large Language Models in Cybersecurity

Gabriel de Jesus Coelho da Silva

Carlos Becker Westphall

261

26 Feb 2024

Why Transformers Need Adam: A Hessian Perspective

Ziniu Li

371

26 Feb 2024

Personalized Federated Instruction Tuning via Neural Architecture Search

Peng Zhang

Yingbo Zhou

Ming Hu

207

26 Feb 2024

Referee Can Play: An Alternative Approach to Conditional Generation via Model Inversion

Tianyang Hu

207

26 Feb 2024

Sparse MeZO: Less Parameters for Better Performance in Zeroth-Order LLM Fine-Tuning

Yong Liu

Yang You

244

24 Feb 2024

Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer

672

23 Feb 2024

A Survey on Knowledge Distillation of Large Language Models

464

235

20 Feb 2024

GNNavi: Navigating the Information Flow in Large Language Models by Graph Neural Network

225

18 Feb 2024

Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark

...

413

102

18 Feb 2024

LoRETTA: Low-Rank Economic Tensor-Train Adaptation for Ultra-Low-Parameter Fine-Tuning of Large Language Models

201

18 Feb 2024

Improved Regret for Bandit Convex Optimization with Delayed Feedback

304

14 Feb 2024

The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes

Ming Jin

267

14 Feb 2024