Generalization Bounds of SGLD for Non-convex Learning: Two Theoretical Viewpoints

19 July 2017

Papers citing "Generalization Bounds of SGLD for Non-convex Learning: Two Theoretical Viewpoints"

50 / 107 papers shown

Scaling Law Analysis in Federated Learning: How to Select the Optimal Model Size?

329

15 Nov 2025

On the Alignment Between Supervised and Self-Supervised Contrastive Learning

211

09 Oct 2025

RamPINN: Recovering Raman Spectra From Coherent Anti-Stokes Spectra Using Embedded Physics

Sai Karthikeya Vemuri

Adithya Ashok Chalain Valapil

Tim Buchner

Joachim Denzler

151

07 Oct 2025

Generalization Bound of Gradient Flow through Training Trajectory and Data-dependent Kernel

305

12 Jun 2025

Algorithm- and Data-Dependent Generalization Bounds for Diffusion Models

248

04 Jun 2025

Information-theoretic Generalization Analysis for VQ-VAEs: A Role of Latent Variables

Futoshi Futami

Masahiro Fujisawa

DRL CML

526

26 May 2025

Temperature is All You Need for Generalization in Langevin Dynamics and other Markov Processes

471

25 May 2025

Randomized Pairwise Learning with Adaptive Sampling: A PAC-Bayes Analysis

Sijia Zhou

Yunwen Lei

Ata Kabán

400

03 Apr 2025

Towards Auto-Regressive Next-Token Prediction: In-Context Learning Emerges from GeneralizationInternational Conference on Learning Representations (ICLR), 2025

360

24 Feb 2025

Understanding Generalization in Transformers: Error Bounds and Training Dynamics Under Benign and Harmful Overfitting

273

18 Feb 2025

Generalization Bounds for Markov Algorithms through Entropy Flow Computations

369

11 Feb 2025

Rethinking generalization of classifiers in separable classes scenarios and over-parameterized regimesIEEE International Joint Conference on Neural Network (IJCNN), 2024

Julius Martinetz

C. Linse

Thomas Martinetz

395

22 Oct 2024

Generalization and Robustness of the Tilted Empirical Risk

517

28 Sep 2024

Information-theoretic Generalization Analysis for Expected Calibration Error

Futoshi Futami

Masahiro Fujisawa

UQCV CML

400

24 May 2024

Uniform Generalization Bounds on Data-Dependent Hypothesis Sets via PAC-Bayesian Theory on Random Sets

Benjamin Dupuis

Paul Viallard

George Deligiannidis

Umut Simsekli

382

26 Apr 2024

Tighter Generalisation Bounds via Interpolation

355

07 Feb 2024

Subsampling is not Magic: Why Large Batch Sizes Work for Differentially Private Stochastic Optimisation

Ossi Raisa

Hibiki Ito

Antti Honkela

316

06 Feb 2024

Adam-like Algorithm with Smooth Clipping Attains Global Minima: Analysis Based on Ergodicity of Functional SDEs

Keisuke Suzuki

234

29 Nov 2023

Using Stochastic Gradient Descent to Smooth Nonconvex Functions: Analysis of Implicit Graduated Optimization with Optimal Noise Scheduling

Naoki Sato

Hideaki Iiduka

437

15 Nov 2023

Information-Theoretic Generalization Bounds for Transductive Learning and its Applications

Huayi Tang

Yong Liu

553

08 Nov 2023

Time-Independent Information-Theoretic Generalization Bounds for SGLDNeural Information Processing Systems (NeurIPS), 2023

Futoshi Futami

Masahiro Fujisawa

452

02 Nov 2023

Generalization Bounds for Label Noise Stochastic Gradient DescentInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Jung Eun Huh

Patrick Rebeschini

377

01 Nov 2023

Sample-Conditioned Hypothesis Stability Sharpens Information-Theoretic Generalization BoundsNeural Information Processing Systems (NeurIPS), 2023

Ziqiao Wang

Yongyi Mao

402

31 Oct 2023

Minibatch and Local SGD: Algorithmic Stability and Linear Speedup in Generalization

Yunwen Lei

Tao Sun

Mingrui Liu

573

02 Oct 2023

A Survey on Privacy in Graph Neural Networks: Attacks, Preservation, and ApplicationsIEEE Transactions on Knowledge and Data Engineering (TKDE), 2023

Olivera Kotevska

Philip S. Yu

Hanyu Wang

464

31 Aug 2023

Towards Understanding the Generalizability of Delayed Stochastic Gradient DescentIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

492

18 Aug 2023

Power-law Dynamic arising from machine learning

244

16 Jun 2023

Understanding Generalization of Federated Learning via Stability: Heterogeneity MattersInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

288

06 Jun 2023

Stochastic Gradient Langevin Dynamics Based on Quantization with Increasing Resolution

Jinwuk Seok

Chang-Jae Cho

376

30 May 2023

Generalization Guarantees of Gradient Descent for Multi-Layer Neural NetworksNeural Computation (Neural Comput.), 2023

366

26 May 2023

Uniform-in-Time Wasserstein Stability Bounds for (Noisy) Stochastic Gradient DescentNeural Information Processing Systems (NeurIPS), 2023

321

20 May 2023

Select without Fear: Almost All Mini-Batch Schedules Generalize Optimally

Konstantinos E. Nikolakakis

Amin Karbasi

Dionysis Kalogerias

399

03 May 2023

AdapterGNN: Parameter-Efficient Fine-Tuning Improves Generalization in GNNsAAAI Conference on Artificial Intelligence (AAAI), 2023

Shengrui Li

Xueting Han

Jing Bai

AI4CE

229

19 Apr 2023

Benign Overfitting for Two-layer ReLU Convolutional Neural NetworksInternational Conference on Machine Learning (ICML), 2023

Quanquan Gu

261

07 Mar 2023

Geometric ergodicity of SGLD via reflection couplingStochastics and Dynamics (SD), 2023

Lei Li

Jian‐Guo Liu

Yuliang Wang

182

17 Jan 2023

Do highly over-parameterized neural networks generalize since bad solutions are rare?IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

Julius Martinetz

T. Martinetz

531

07 Nov 2022

On the Importance of Gradient Norm in PAC-Bayesian BoundsNeural Information Processing Systems (NeurIPS), 2022

Yossi Adi

326

12 Oct 2022

Differentially Private Deep Learning with ModelMix

Hanshen Xiao

Jun Wan

S. Devadas

280

07 Oct 2022

Exploring the Algorithm-Dependent Generalization of AUPRC Optimization with List StabilityNeural Information Processing Systems (NeurIPS), 2022

335

27 Sep 2022

Generalisation under gradient descent via deterministic PAC-BayesInternational Conference on Algorithmic Learning Theory (ALT), 2022

George Deligiannidis

504

06 Sep 2022

Super-model ecosystem: A domain-adaptation perspective

Fengxiang He

Dacheng Tao

DiffM

208

30 Aug 2022

A sharp uniform-in-time error estimate for Stochastic Gradient Langevin DynamicsCSIAM Transactions on Applied Mathematics (TCAM), 2022

Lei Li

Yuliang Wang

439

19 Jul 2022

Max-Margin Works while Large Margin Fails: Generalization without Uniform ConvergenceInternational Conference on Learning Representations (ICLR), 2022

372

16 Jun 2022

Stability and Generalization of Stochastic Optimization with Nonconvex and Nonsmooth ProblemsAnnual Conference Computational Learning Theory (COLT), 2022

Yunwen Lei

322

14 Jun 2022

Generalization Error Bounds for Deep Neural Networks Trained by SGD

Mingze Wang

Chao Ma

174

07 Jun 2022

Algorithmic Stability of Heavy-Tailed Stochastic Gradient Descent on Least SquaresInternational Conference on Algorithmic Learning Theory (ALT), 2022

310

02 Jun 2022

Generalization Bounds for Gradient Methods via Discrete and Continuous PriorNeural Information Processing Systems (NeurIPS), 2022

Jun Yu Li

Xu Luo

Jian Li

389

27 May 2022

Uniform Generalization Bound on Time and Inverse Temperature for Gradient Descent Algorithm and its Application to Analysis of Simulated Annealing

Keisuke Suzuki

AI4CE

279

25 May 2022

Weak Convergence of Approximate reflection coupling and its Application to Non-convex Optimization

Keisuke Suzuki

318

24 May 2022

Beyond Lipschitz: Sharp Generalization and Excess Risk Bounds for Full-Batch GDInternational Conference on Learning Representations (ICLR), 2022

Konstantinos E. Nikolakakis

Farzin Haddadpour

Amin Karbasi

Dionysios S. Kalogerias

555

26 Apr 2022