Title
Perturbation-efficient Zeroth-order Optimization for Hardware-friendly On-device Training Qitao Tan Sung-En Chang Rui Xia Huidong Ji Chence Yang ... Zheng Zhan Zhou Zou Y. Wang Jin Lu Geng Yuan 41 0 0 28 Apr 2025
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization Yang Jiao X. Wang Kai Yang AAML SILM 31 0 0 10 Apr 2025
Scalable Back-Propagation-Free Training of Optical Physics-Informed Neural Networks Yequan Zhao Xinling Yu Xian Xiao Z. Chen Z. Liu G. Kurczveil R. Beausoleil S. Liu Z. Zhang 45 0 0 17 Feb 2025
COAP: Memory-Efficient Training with Correlation-Aware Gradient Projection Jinqi Xiao S. Sang Tiancheng Zhi Jing Liu Qing Yan Linjie Luo Bo Yuan Bo Yuan VLM 81 1 0 26 Nov 2024
FLOPS: Forward Learning with OPtimal Sampling Tao Ren Zishi Zhang Jinyang Jiang Guanghao Li Zeliang Zhang Mingqian Feng Yijie Peng 30 1 0 08 Oct 2024
Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization Zhe Li Bicheng Ying Zidong Liu Haibo Yang Haibo Yang FedML 54 3 0 24 May 2024
Second-Order Fine-Tuning without Pain for LLMs:A Hessian Informed Zeroth-Order Optimizer Yanjun Zhao Sizhe Dang Haishan Ye Guang Dai Yi Qian Ivor W.Tsang 61 8 0 23 Feb 2024
Private Fine-tuning of Large Language Models with Zeroth-order Optimization Xinyu Tang Ashwinee Panda Milad Nasr Saeed Mahloujifar Prateek Mittal 42 18 0 09 Jan 2024
Scaling Forward Gradient With Local Losses Mengye Ren Simon Kornblith Renjie Liao Geoffrey E. Hinton 64 49 0 07 Oct 2022
Optimization without Backpropagation Gabriel Belouze 14 7 0 13 Sep 2022
AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition Shoufa Chen Chongjian Ge Zhan Tong Jiangliu Wang Yibing Song Jue Wang Ping Luo 141 631 0 26 May 2022
P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks Xiao Liu Kaixuan Ji Yicheng Fu Weng Lam Tam Zhengxiao Du Zhilin Yang Jie Tang VLM 236 780 0 14 Oct 2021
MSP: Multi-Stage Prompting for Making Pre-trained Language Models Better Translators Zhixing Tan Xiangwen Zhang Shuo Wang Yang Liu VLM LRM 193 51 0 13 Oct 2021
Curvature-Aware Derivative-Free Optimization Bumsu Kim HanQin Cai Daniel McKenzie W. Yin ODL 14 10 0 27 Sep 2021
The Power of Scale for Parameter-Efficient Prompt Tuning Brian Lester Rami Al-Rfou Noah Constant VPVLM 278 3,784 0 18 Apr 2021
Optimizing Large-Scale Hyperparameters via Automated Learning Algorithm Bin Gu Guodong Liu Yanfu Zhang Xiang Geng Heng-Chiao Huang 31 18 0 17 Feb 2021
ZeRO-Offload: Democratizing Billion-Scale Model Training Jie Ren Samyam Rajbhandari Reza Yazdani Aminabadi Olatunji Ruwase Shuangyang Yang Minjia Zhang Dong Li Yuxiong He MoE 157 399 0 18 Jan 2021
Making Pre-trained Language Models Better Few-shot Learners Tianyu Gao Adam Fisch Danqi Chen 241 1,898 0 31 Dec 2020
The Lottery Ticket Hypothesis for Pre-trained BERT Networks Tianlong Chen Jonathan Frankle Shiyu Chang Sijia Liu Yang Zhang Zhangyang Wang Michael Carbin 148 345 0 23 Jul 2020
Sign-OPT: A Query-Efficient Hard-label Adversarial Attack Minhao Cheng Simranjit Singh Patrick H. Chen Pin-Yu Chen Sijia Liu Cho-Jui Hsieh AAML 122 218 0 24 Sep 2019
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,927 0 20 Apr 2018