v1v2v3 (latest)

ASAM: Adaptive Sharpness-Aware Minimization for Scale-Invariant Learning of Deep Neural Networks

International Conference on Machine Learning (ICML), 2021

23 February 2021

Papers citing "ASAM: Adaptive Sharpness-Aware Minimization for Scale-Invariant Learning of Deep Neural Networks"

50 / 224 papers shown

FlatNAS: optimizing Flatness in Neural Architecture Search for Out-of-Distribution Robustness

332

29 Feb 2024

Gradient Alignment for Cross-Domain Face Anti-Spoofing

B. Le

Simon S. Woo

CVBM

391

29 Feb 2024

Effective Gradient Sample Size via Variation Estimation for Accelerating Sharpness aware Minimization

212

24 Feb 2024

Helen: Optimizing CTR Prediction Models with Frequency-wise Hessian Eigenvalue Regularization

Zirui Zhu

Yong Liu

Zangwei Zheng

Huifeng Guo

Yang You

149

23 Feb 2024

On the Duality Between Sharpness-Aware Minimization and Adversarial Training

Huanran Chen

Zeming Wei

390

23 Feb 2024

Mirror Gradient: Towards Robust Multimodal Recommender Systems via Exploring Flat Local Minima

256

17 Feb 2024

Subgraphormer: Unifying Subgraph GNNs and Graph Transformers via Graph Products

312

13 Feb 2024

Curvature-Informed SGD via General Purpose Lie-Group Preconditioners

Omead Brandon Pooladzandi

Xi-Lin Li

245

07 Feb 2024

A Precise Characterization of SGD Stability Using Loss Surface GeometryInternational Conference on Learning Representations (ICLR), 2024

246

22 Jan 2024

Momentum-SAM: Sharpness Aware Minimization without Computational Overhead

Marlon Becker

Frederick Altrock

Benjamin Risse

493

22 Jan 2024

Stabilizing Sharpness-aware Minimization Through A Simple Renormalization Strategy

312

14 Jan 2024

ELSA: Partial Weight Freezing for Overhead-Free Sparse Network Deployment

Paniz Halvachi

Alexandra Peste

Dan Alistarh

Christoph H. Lampert

182

11 Dec 2023

Generalization Bounds for Robust Contrastive Learning: From Theory to Practice

375

16 Nov 2023

Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization with Optimal Noise Scheduling

Naoki Sato

Hideaki Iiduka

384

15 Nov 2023

FlatMatch: Bridging Labeled Data and Unlabeled Data with Cross-Sharpness for Semi-Supervised LearningNeural Information Processing Systems (NeurIPS), 2023

Li Shen

Bo Han

264

25 Oct 2023

Winning Prize Comes from Losing Tickets: Improve Invariant Learning by Exploring Variant Parameters for Out-of-Distribution GeneralizationInternational Journal of Computer Vision (IJCV), 2023

Li Shen

Bo Han

291

25 Oct 2023

Why Does Sharpness-Aware Minimization Generalize Better Than SGD?Neural Information Processing Systems (NeurIPS), 2023

Quanquan Gu

319

11 Oct 2023

Asymmetrically Decentralized Federated LearningIEEE transactions on computers (IEEE Trans. Comput.), 2023

Nan Yin

313

08 Oct 2023

TRAM: Bridging Trust Regions and Sharpness Aware MinimizationInternational Conference on Learning Representations (ICLR), 2023

375

05 Oct 2023

A simple connection from loss flatness to compressed neural representations

Shirui Chen

Stefano Recanatesi

E. Shea-Brown

288

03 Oct 2023

Window-based Model Averaging Improves Generalization in Heterogeneous Federated Learning

257

02 Oct 2023

Membership Privacy Risks of Sharpness Aware Minimization

389

30 Sep 2023

Sharpness-Aware Teleportation on Riemannian Manifolds

363

29 Sep 2023

Enhancing Sharpness-Aware Optimization Through Variance SuppressionNeural Information Processing Systems (NeurIPS), 2023

Bingcong Li

G. Giannakis

AAML

448

27 Sep 2023

Accelerating Large Batch Training via Gradient Signal to Noise Ratio (GSNR)

221

24 Sep 2023

Create and Find Flatness: Building Flat Training Spaces in Advance for Continual LearningEuropean Conference on Artificial Intelligence (ECAI), 2023

238

20 Sep 2023

Gradient constrained sharpness-aware prompt learning for vision-language models

Nannan Wang

Xinbo Gao

228

14 Sep 2023

Adversarial Collaborative Filtering for FreeACM Conference on Recommender Systems (RecSys), 2023

Huiyuan Chen

Xiaoting Li

Vivian Lai

Chin-Chia Michael Yeh

Yan Zheng

137

20 Aug 2023

DFedADMM: Dual Constraints Controlled Model Inconsistency for Decentralized Federated Learning

Li Shen

132

16 Aug 2023

ImbSAM: A Closer Look at Sharpness-Aware Minimization in Class-Imbalanced RecognitionIEEE International Conference on Computer Vision (ICCV), 2023

Yixuan Zhou

Yi Qu

Xing Xu

Hengtao Shen

142

15 Aug 2023

G-Mix: A Generalized Mixup Learning Framework Towards Flat MinimaIEEE Transactions on Artificial Intelligence (IEEE TAI), 2023

Xingyu Li

Bo Tang

AAML

214

07 Aug 2023

Improving Generalization of Adversarial Training via Robust Critical Fine-TuningIEEE International Conference on Computer Vision (ICCV), 2023

171

01 Aug 2023

Flatness-Aware Minimization for Domain GeneralizationIEEE International Conference on Computer Vision (ICCV), 2023

272

20 Jul 2023

Promoting Exploration in Memory-Augmented Adam using Critical Momenta

Pranshu Malviya

Gonçalo Mordido

A. Baratin

Reza Babanezhad Harikandeh

242

18 Jul 2023

Sharpness-Aware Graph Collaborative FilteringAnnual International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2023

Huiyuan Chen

Chin-Chia Michael Yeh

Yujie Fan

Yan Zheng

Junpeng Wang

Vivian Lai

Mahashweta Das

Hao Yang

171

18 Jul 2023

FAM: Relative Flatness Aware Minimization

182

05 Jul 2023

Systematic Investigation of Sparse Perturbed Sharpness-Aware Minimization OptimizerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Li Shen

256

30 Jun 2023

Adaptive Sharpness-Aware Pruning for Robust Sparse NetworksInternational Conference on Learning Representations (ICLR), 2023

293

25 Jun 2023

The Inductive Bias of Flatness Regularization for Deep Matrix Factorization

193

22 Jun 2023

Practical Sharpness-Aware Minimization Cannot Converge All the Way to OptimaNeural Information Processing Systems (NeurIPS), 2023

Dongkuk Si

Chulhee Yun

426

16 Jun 2023

The Split Matters: Flat Minima Methods for Improving the Performance of GNNsInternational Cross-Domain Conference on Machine Learning and Knowledge Extraction (CD-MAKE), 2023

N. Lell

A. Scherp

232

15 Jun 2023

Tokenization with Factorized Subword EncodingAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

David Samuel

Lilja Øvrelid

192

13 Jun 2023

Normalization Layers Are All That Sharpness-Aware Minimization NeedsNeural Information Processing Systems (NeurIPS), 2023

Maximilian Mueller

Tiffany J. Vlaar

David Rolnick

Matthias Hein

283

07 Jun 2023

Optimal Transport Model Distributional RobustnessNeural Information Processing Systems (NeurIPS), 2023

Van-Anh Nguyen

Trung Le

283

07 Jun 2023

Multi-Dataset Co-Training with Sharpness-Aware Optimization for Audio Anti-spoofingInterspeech (Interspeech), 2023

Hye-jin Shim

Jee-weon Jung

Tomi Kinnunen

192

31 May 2023

Sharpness-Aware Minimization Leads to Low-Rank FeaturesNeural Information Processing Systems (NeurIPS), 2023

Maksym Andriushchenko

391

25 May 2023

Sharpness-Aware Minimization Revisited: Weighted Sharpness as a Regularization TermKnowledge Discovery and Data Mining (KDD), 2023

256

25 May 2023

The Crucial Role of Normalization in Sharpness-Aware MinimizationNeural Information Processing Systems (NeurIPS), 2023

Yan Dai

Kwangjun Ahn

S. Sra

362

24 May 2023

Towards More Suitable Personalization in Federated Learning via Decentralized Partial Model Training

Li Shen

233

24 May 2023

Improving Convergence and Generalization Using Parameter SymmetriesInternational Conference on Learning Representations (ICLR), 2023

399

22 May 2023