v1v2v3 (latest)

Hausdorff Dimension, Heavy Tails, and Generalization in Neural Networks

16 June 2020

George Deligiannidis

Papers citing "Hausdorff Dimension, Heavy Tails, and Generalization in Neural Networks"

49 / 49 papers shown

Geometric Properties of Neural Multivariate Regression

187

01 Oct 2025

Optimal Condition for Initialization Variance in Deep Neural Networks: An SGD Dynamics Perspective

Hiroshi Horii

Sothea Has

140

18 Aug 2025

Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias

511

06 Jun 2025

Generalization Guarantees for Multi-View Representation Learning and Application to Regularization via Gaussian Product Mixture Prior

Romain Chor

Abdellatif Zaidi

Piotr Krasnowski

331

25 Apr 2025

Short-PHD: Detecting Short LLM-generated Text with Topological Data Analysis After Off-topic Content Insertion

374

01 Apr 2025

Almost Bayesian: The Fractal Dynamics of Stochastic Gradient Descent

Max Hennick

Stijn De Baerdemacker

277

28 Mar 2025

Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture PriorsInternational Conference on Learning Representations (ICLR), 2025

Romain Chor

Milad Sefidgaran

Piotr Krasnowski

611

21 Feb 2025

Model Balancing Helps Low-data Training and Fine-tuningConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

256

16 Oct 2024

From Spikes to Heavy Tails: Unveiling the Spectral Evolution of Neural Networks

454

07 Jun 2024

Slicing Mutual Information Generalization Bounds for Neural Networks

Kimia Nadjahi

Kristjan Greenewald

Rickard Brüel-Gabrielsson

Justin Solomon

266

06 Jun 2024

On the Limitations of Fractal Dimension as a Measure of Generalization

262

04 Jun 2024

Uniform Generalization Bounds on Data-Dependent Hypothesis Sets via PAC-Bayesian Theory on Random Sets

Benjamin Dupuis

Paul Viallard

George Deligiannidis

Umut Simsekli

381

26 Apr 2024

Tracking the Median of Gradients with a Stochastic Proximal Point Method

376

20 Feb 2024

Tighter Generalisation Bounds via Interpolation

347

07 Feb 2024

Minimum Description Length and Generalization Guarantees for Representation LearningNeural Information Processing Systems (NeurIPS), 2024

Romain Chor

Abdellatif Zaidi

Piotr Krasnowski

376

05 Feb 2024

Emergence of heavy tails in homogenized stochastic gradient descent

Zhe Jiao

Martin Keller-Ressel

213

02 Feb 2024

From Mutual Information to Expected Dynamics: New Generalization Bounds for Heavy-Tailed SGD

Benjamin Dupuis

Paul Viallard

367

01 Dec 2023

Temperature Balancing, Layer-wise Weight Analysis, and Neural Network TrainingNeural Information Processing Systems (NeurIPS), 2023

476

01 Dec 2023

Approximate Heavy Tails in Offline (Multi-Pass) Stochastic Gradient DescentNeural Information Processing Systems (NeurIPS), 2023

Krunoslav Lehman Pavasovic

Alain Durmus

Umut Simsekli

OffRL

237

27 Oct 2023

Generalization Guarantees via Algorithm-dependent Rademacher ComplexityAnnual Conference Computational Learning Theory (COLT), 2023

322

04 Jul 2023

Deep neural networks architectures from the perspective of manifold learning

German Magai

AAML AI4CE

273

06 Jun 2023

Metric Space Magnitude and Generalisation in Neural Networks

266

09 May 2023

Heavy-Tailed Regularization of Weight Matrices in Deep Neural NetworksInternational Conference on Artificial Neural Networks (ICANN), 2023

373

06 Apr 2023

Efficient Sampling of Stochastic Differential Equations with Positive Semi-Definite ModelsNeural Information Processing Systems (NeurIPS), 2023

457

30 Mar 2023

Heterogeneous Neuronal and Synaptic Dynamics for Spike-Efficient Unsupervised Learning: Theory and Design PrinciplesInternational Conference on Learning Representations (ICLR), 2023

Biswadeep Chakraborty

Saibal Mukhopadhyay

252

22 Feb 2023

Cyclic and Randomized Stepsizes Invoke Heavier Tails in SGD than Constant Stepsize

390

10 Feb 2023

Generalization Bounds with Data-dependent Fractal DimensionsInternational Conference on Machine Learning (ICML), 2023

Benjamin Dupuis

George Deligiannidis

Umut cSimcsekli

AI4CE

253

06 Feb 2023

Algorithmic Stability of Heavy-Tailed SGD with General Loss FunctionsInternational Conference on Machine Learning (ICML), 2023

276

27 Jan 2023

Two Facets of SDE Under an Information-Theoretic Lens: Generalization of SGD via Training Trajectories and via Terminal StatesConference on Uncertainty in Artificial Intelligence (UAI), 2022

Ziqiao Wang

Yongyi Mao

383

19 Nov 2022

Neural Networks Efficiently Learn Low-Dimensional Representations with SGDInternational Conference on Learning Representations (ICLR), 2022

Alireza Mousavi-Hosseini

Sejun Park

M. Girotti

Ioannis Mitliagkas

Murat A. Erdogdu

MLT

650

29 Sep 2022

$Generalization Bounds for Stochastic Gradient Descent via Localized $\varepsilon$-Covers$

Generalization Bounds for Stochastic Gradient Descent via Localized

\varepsilon

-CoversNeural Information Processing Systems (NeurIPS), 2022

Sejun Park

Umut Simsekli

Murat A. Erdogdu

231

19 Sep 2022

Trajectory-dependent Generalization Bounds for Deep Neural Networks via Fractional Brownian Motion

Chengli Tan

Jiang Zhang

Junmin Liu

255

09 Jun 2022

Rate-Distortion Theoretic Bounds on Generalization Error for Distributed LearningNeural Information Processing Systems (NeurIPS), 2022

336

06 Jun 2022

Algorithmic Stability of Heavy-Tailed Stochastic Gradient Descent on Least SquaresInternational Conference on Algorithmic Learning Theory (ALT), 2022

299

02 Jun 2022

Generalization Bounds for Gradient Methods via Discrete and Continuous PriorNeural Information Processing Systems (NeurIPS), 2022

Jun Yu Li

Xu Luo

Jian Li

378

27 May 2022

Chaotic Regularization and Heavy-Tailed Limits for Deterministic Gradient DescentNeural Information Processing Systems (NeurIPS), 2022

Soon Hoe Lim

Yijun Wan

Umut cSimcsekli

296

23 May 2022

Heavy-Tail Phenomenon in Decentralized SGDIISE Transactions (IISE Trans.), 2022

399

13 May 2022

Topology and geometry of data manifold in deep learning

German Magai

A. Ayzenberg

AAML

297

19 Apr 2022

Predicting the generalization gap in neural networks using topological data analysisNeurocomputing (Neurocomputing), 2022

Rubén Ballester

Xavier Arnal Clemente

326

23 Mar 2022

Rate-Distortion Theoretic Generalization Bounds for Stochastic Learning AlgorithmsAnnual Conference Computational Learning Theory (COLT), 2022

342

04 Mar 2022

On the Hidden Biases of Policy Mirror Ascent in Continuous Action SpacesInternational Conference on Machine Learning (ICML), 2022

392

28 Jan 2022

Intrinsic Dimension, Persistent Homology and Generalization in Neural NetworksNeural Information Processing Systems (NeurIPS), 2021

300

25 Nov 2021

On the Sample Complexity and Metastability of Heavy-tailed Policy Search in Continuous Control

Mengdi Wang

215

15 Jun 2021

Fractal Structure and Generalization Properties of Stochastic Optimization AlgorithmsNeural Information Processing Systems (NeurIPS), 2021

George Deligiannidis

179

09 Jun 2021

Heavy Tails in SGD and Compressibility of Overparametrized Neural NetworksNeural Information Processing Systems (NeurIPS), 2021

311

07 Jun 2021

Characterization of Generalizability of Spike Timing Dependent Plasticity trained Spiking Neural NetworksFrontiers in Neuroscience (Front. Neurosci.), 2021

Biswadeep Chakraborty

Saibal Mukhopadhyay

285

31 May 2021

A Fully Spiking Hybrid Neural Network for Energy-Efficient Object DetectionIEEE Transactions on Image Processing (TIP), 2021

Biswadeep Chakraborty

Xueyuan She

Saibal Mukhopadhyay

293

21 Apr 2021

Strength of Minibatch Noise in SGDInternational Conference on Learning Representations (ICLR), 2021

395

10 Feb 2021

Noise and Fluctuation of Finite Learning Rate Stochastic Gradient Descent

553

07 Dec 2020