v1v2 (latest)

Is Local SGD Better than Minibatch SGD?

International Conference on Machine Learning (ICML), 2020

18 February 2020

Papers citing "Is Local SGD Better than Minibatch SGD?"

50 / 156 papers shown

On the Convergence and Stability of Distributed Sub-model Training

244

08 Nov 2025

Personalized Collaborative Learning with Affinity-Based Variance Reduction

Chenyu Zhang

Navid Azizan

136

17 Oct 2025

FedMuon: Federated Learning with Bias-corrected LMO-based Optimization

173

30 Sep 2025

MAUI: Reconstructing Private Client Data in Federated Transfer Learning

156

14 Sep 2025

Understanding Outer Optimizers in Local SGD: Learning Rates, Momentum, and Acceleration

281

12 Sep 2025

Constant Stepsize Local GD for Logistic Regression: Acceleration by Instability

M. Crawshaw

Blake Woodworth

Mingrui Liu

249

16 Jun 2025

Sharp Gaussian approximations for Decentralized Federated Learning

377

12 May 2025

Heterogeneity Matters even More in Distributed Learning: Study from Generalization Perspective

457

03 Mar 2025

Addressing Label Shift in Distributed Learning via Entropy RegularizationInternational Conference on Learning Representations (ICLR), 2025

398

04 Feb 2025

Revisiting LocalSGD and SCAFFOLD: Improved Rates and Missing AnalysisInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

550

08 Jan 2025

Characterizing the Accuracy-Communication-Privacy Trade-off in Distributed Stochastic Convex OptimizationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2025

300

06 Jan 2025

A Unified Analysis of Federated Learning with Arbitrary Client ParticipationNeural Information Processing Systems (NeurIPS), 2022

Maroun Touma

Mingyue Ji

FedML

687

31 Dec 2024

MARINA-P: Superior Performance in Non-smooth Federated Optimization with Adaptive Stepsizes

Igor Sokolov

Peter Richtárik

330

22 Dec 2024

Task Arithmetic Through The Lens Of One-Shot Federated Learning

559

27 Nov 2024

An End-to-End Real-World Camera Imaging PipelineACM Multimedia (MM), 2024

468

16 Nov 2024

SDP4Bit: Toward 4-bit Communication Quantization in Sharded Data Parallelism for LLM TrainingNeural Information Processing Systems (NeurIPS), 2024

...

328

20 Oct 2024

Randomized Asymmetric Chain of LoRA: The First Meaningful Theoretical Framework for Low-Rank Adaptation

299

10 Oct 2024

Communication-Efficient Federated Group Distributionally Robust OptimizationNeural Information Processing Systems (NeurIPS), 2024

Zhishuai Guo

Tianbao Yang

FedML

385

08 Oct 2024

MindFlayer SGD: Efficient Parallel SGD in the Presence of Heterogeneous and Random Worker Compute TimesConference on Uncertainty in Artificial Intelligence (UAI), 2024

Artavazd Maranjyan

Omar Shaikh Omar

Peter Richtárik

301

05 Oct 2024

Does Worst-Performing Agent Lead the Pack? Analyzing Agent Dynamics in Unified Distributed SGDNeural Information Processing Systems (NeurIPS), 2024

360

26 Sep 2024

Federated Frank-Wolfe Algorithm

246

19 Aug 2024

A New Theoretical Perspective on Data Heterogeneity in Federated Optimization

259

22 Jul 2024

Accelerating Distributed Optimization: A Primal-Dual Perspective on Local Steps

Junchi Yang

Murat Yildirim

Qiu Feng

473

02 Jul 2024

Communication-Efficient Adaptive Batch Size Strategies for Distributed Local Gradient Methods

344

20 Jun 2024

Distributed Stochastic Gradient Descent with Staleness: A Stochastic Delay Differential Equation Based Framework

Siyuan Yu

Wei Chen

H. V. Poor

390

17 Jun 2024

The Limits and Potentials of Local SGD for Distributed Heterogeneous Learning with Intermittent Communication

285

19 May 2024

Improved Generalization Bounds for Communication Efficient Federated Learning

Peyman Gholami

H. Seferoglu

FedML AI4CE

413

17 Apr 2024

Communication-Efficient Large-Scale Distributed Deep Learning: A Comprehensive Survey

Xiping Hu

375

09 Apr 2024

The Effectiveness of Local Updates for Decentralized Learning under Data HeterogeneityIEEE Transactions on Signal Processing (IEEE TSP), 2024

Tongle Wu

Ying Sun

208

23 Mar 2024

On the Convergence of Federated Learning Algorithms without Data Similarity

336

29 Feb 2024

Decomposable Submodular Maximization in Federated Setting

Akbar Rafiey

FedML

474

31 Jan 2024

High Confidence Level Inference is Almost Free using Parallel Stochastic Optimization

248

17 Jan 2024

Differentially Private Low-Rank Adaptation of Large Language Model Using Federated LearningACM Transactions on Management Information Systems (ACM TMIS), 2023

Daochen Zha

316

29 Dec 2023

A New Random Reshuffling Method for Nonsmooth Nonconvex Finite-sum Optimization

Junwen Qiu

Xiao Li

Andre Milzarek

642

02 Dec 2023

Federated Online and Bandit Convex OptimizationInternational Conference on Machine Learning (ICML), 2023

301

29 Nov 2023

Asynchronous SGD on Graphs: a Unified Framework for Asynchronous Decentralized and Federated OptimizationInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Mathieu Even

Anastasia Koloskova

Laurent Massoulié

FedML

367

01 Nov 2023

High-probability Convergence Bounds for Nonlinear Stochastic Gradient Descent Under Heavy-tailed Noise

744

28 Oct 2023

A Quadratic Synchronization Rule for Distributed Deep LearningInternational Conference on Learning Representations (ICLR), 2023

330

22 Oct 2023

Utilizing Free Clients in Federated Learning for Focused Model Enhancement

Aditya Narayan Ravi

Ilan Shomorony

FedML

282

06 Oct 2023

Minibatch and Local SGD: Algorithmic Stability and Linear Speedup in Generalization

Yunwen Lei

Tao Sun

Mingrui Liu

491

02 Oct 2023

FedLALR: Client-Specific Adaptive Learning Rates Achieve Linear Speedup for Non-IID Data

Li Shen

228

18 Sep 2023

FedGKD: Unleashing the Power of Collaboration in Federated Graph Neural Networks

Ruofan Wu

328

18 Sep 2023

FedSOL: Stabilized Orthogonal Learning with Proximal Restrictions in Federated LearningComputer Vision and Pattern Recognition (CVPR), 2023

398

24 Aug 2023

Noise Balance and Stationary Distribution of Stochastic Gradient DescentPhysical Review E (PRE), 2023

Liu Ziyin

Hongchao Li

Masakuni Ueda

252

13 Aug 2023

Efficient Federated Learning via Local Adaptive Amended Optimizer with Linear SpeedupIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Li Shen

Liang Ding

181

30 Jul 2023

On the Computation-Communication Trade-Off with A Flexible Gradient Tracking ApproachIEEE Conference on Decision and Control (CDC), 2023

Yan Huang

Jinming Xu

245

12 Jun 2023

Communication-Efficient Gradient Descent-Accent Methods for Distributed Variational Inequalities: Unified Analysis and Local UpdatesInternational Conference on Learning Representations (ICLR), 2023

522

08 Jun 2023

Improving Accelerated Federated Learning with Compression and Importance Sampling

290

05 Jun 2023

Federated Composite Saddle Point Optimization

Site Bai

Brian Bullins

FedML

180

25 May 2023

Dynamic Regularized Sharpness Aware Minimization in Federated Learning: Approaching Global Consistency and Smooth LandscapeInternational Conference on Machine Learning (ICML), 2023

Li Shen

Liang Ding

334

19 May 2023