Revisiting the Noise Model of Stochastic Gradient Descent

International Conference on Artificial Intelligence and Statistics (AISTATS), 2023

5 March 2023

Barak Battash

Ofir Lindenbaum

ArXiv (abs)PDF HTML

Papers citing "Revisiting the Noise Model of Stochastic Gradient Descent"

13 / 13 papers shown

Federated Stochastic Minimax Optimization under Heavy-Tailed Noises

Xinwen Zhang

Hongchang Gao

FedML

388

06 Nov 2025

Second-order Optimization under Heavy-Tailed Noise: Hessian Clipping and Sample Complexity Limits

Abdurakhmon Sadiev

Peter Richtárik

Ilyas Fatkhullin

145

12 Oct 2025

TempoControl: Temporal Attention Guidance for Text-to-Video Models

307

02 Oct 2025

Nonconvex Decentralized Stochastic Bilevel Optimization under Heavy-Tailed Noises

Xinwen Zhang

Yihan Zhang

Hongchang Gao

119

19 Sep 2025

FedEve: On Bridging the Client Drift and Period Drift for Cross-device Federated Learning

162

20 Aug 2025

Can SGD Handle Heavy-Tailed Noise?

Ilyas Fatkhullin

Florian Hübler

Guanghui Lan

128

06 Aug 2025

SUMO: Subspace-Aware Moment-Orthogonalization for Accelerating Memory-Efficient LLM Training

181

30 May 2025

Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent

Max Hennick

Stijn De Baerdemacker

229

28 Mar 2025

AdaRankGrad: Adaptive Gradient-Rank and Moments for Memory-Efficient LLMs Training and Fine-TuningInternational Conference on Learning Representations (ICLR), 2024

300

31 Dec 2024

From Gradient Clipping to Normalization for Heavy Tailed SGDInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2024

Florian Hübler

Ilyas Fatkhullin

Niao He

404

17 Oct 2024

Nonlinear Stochastic Gradient Descent and Heavy-tailed Noise: A Unified Framework and High-probability Guarantees

409

17 Oct 2024

Effect of Random Learning Rate: Theoretical Analysis of SGD Dynamics in Non-Convex Optimization via Stationary Distribution

Naoki Yoshida

Shogo H. Nakakita

Masaaki Imaizumi

259

23 Jun 2024

Distributed Stochastic Gradient Descent with Staleness: A Stochastic Delay Differential Equation Based Framework

Siyuan Yu

Wei Chen

H. V. Poor

357

17 Jun 2024