v1v2 (latest)

Temperature is All You Need for Generalization in Langevin Dynamics and other Markov Processes

25 May 2025

ArXiv (abs)PDF HTML Github

Papers citing "Temperature is All You Need for Generalization in Langevin Dynamics and other Markov Processes"

32 / 32 papers shown

RamPINN: Recovering Raman Spectra From Coherent Anti-Stokes Spectra Using Embedded Physics

Sai Karthikeya Vemuri

Adithya Ashok Chalain Valapil

Tim Buchner

Joachim Denzler

153

07 Oct 2025

Uniform Generalization Bounds on Data-Dependent Hypothesis Sets via PAC-Bayesian Theory on Random Sets

Benjamin Dupuis

Paul Viallard

George Deligiannidis

Umut Simsekli

383

26 Apr 2024

How Uniform Random Weights Induce Non-uniform Bias: Typical Interpolating Neural Networks Generalize with Narrow Teachers

401

09 Feb 2024

Time-Independent Information-Theoretic Generalization Bounds for SGLDNeural Information Processing Systems (NeurIPS), 2023

Futoshi Futami

Masahiro Fujisawa

454

02 Nov 2023

PAC-Bayes Compression Bounds So Tight That They Can Explain GeneralizationNeural Information Processing Systems (NeurIPS), 2022

Sanyam Kapoor

260

24 Nov 2022

Stability and Generalization Analysis of Gradient Methods for Shallow Neural NetworksNeural Information Processing Systems (NeurIPS), 2022

352

19 Sep 2022

Time-independent Generalization Bounds for SGLD in Non-convex Settings

Tyler Farghly

Patrick Rebeschini

256

25 Nov 2021

User-friendly introduction to PAC-Bayes bounds

Pierre Alquier

FedML

722

272

21 Oct 2021

Stochastic Training is Not Necessary for Generalization

533

29 Sep 2021

Random Neural Networks in the Infinite Width Limit as Gaussian Processes

Boris Hanin

BDL

323

04 Jul 2021

Learning with Gradient Descent and Weakly Convex LossesInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2021

Dominic Richards

Michael G. Rabbat

MLT

271

13 Jan 2021

On the role of data in PAC-Bayes bounds

Gintare Karolina Dziugaite

346

19 Jun 2020

On Generalization Error Bounds of Noisy Gradient Methods for Non-Convex LearningInternational Conference on Learning Representations (ICLR), 2019

Jian Li

Xuanyuan Luo

Mingda Qiao

641

02 Feb 2019

Neural Tangent Kernel: Convergence and Generalization in Neural Networks

Arthur Jacot

Franck Gabriel

Clément Hongler

3.5K

3,867

20 Jun 2018

Gaussian Process Behaviour in Wide Deep Neural Networks

617

606

30 Apr 2018

A Mean Field View of the Landscape of Two-Layers Neural Networks

507

960

18 Apr 2018

Stronger generalization bounds for deep nets via a compression approach

800

694

14 Feb 2018

Size-Independent Sample Complexity of Neural Networks

Noah Golowich

Alexander Rakhlin

Ohad Shamir

661

616

18 Dec 2017

Deep Neural Networks as Gaussian Processes

Jascha Narain Sohl-Dickstein

UQCV BDL

1.0K

1,216

01 Nov 2017

Generalization Bounds of SGLD for Non-convex Learning: Two Theoretical Viewpoints

273

174

19 Jul 2017

Spectrally-normalized margin bounds for neural networks

989

1,390

26 Jun 2017

Implicit Regularization in Matrix Factorization

Srinadh Bhojanapalli

447

555

25 May 2017

Information-theoretic analysis of generalization capability of learning algorithms

Aolin Xu

Maxim Raginsky

613

528

22 May 2017

Computing Nonvacuous Generalization Bounds for Deep (Stochastic) Neural Networks with Many More Parameters than Training Data

Gintare Karolina Dziugaite

Daniel M. Roy

584

926

31 Mar 2017

How to Escape Saddle Points Efficiently

576

916

02 Mar 2017

Non-convex learning via Stochastic Gradient Langevin Dynamics: a nonasymptotic analysisAnnual Conference Computational Learning Theory (COLT), 2017

Maxim Raginsky

Alexander Rakhlin

Matus Telgarsky

476

567

13 Feb 2017

Understanding deep learning requires rethinking generalization

Benjamin Recht

955

5,020

10 Nov 2016

How much does your data exploration overfit? Controlling bias via information usage

D. Russo

James Zou

293

219

16 Nov 2015

Train faster, generalize better: Stability of stochastic gradient descent

Moritz Hardt

Benjamin Recht

Y. Singer

559

1,390

03 Sep 2015

Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification

1.4K

20,336

06 Feb 2015

Rényi Divergence and Kullback-Leibler DivergenceIEEE Transactions on Information Theory (IEEE Trans. Inf. Theory), 2012

T. Erven

P. Harremoes

460

1,522

12 Jun 2012

Pac-Bayesian Supervised Classification: The Thermodynamics of Statistical Learning

O. Catoni

735

511

03 Dec 2007