v1v2 (latest)

Do We Need Zero Training Loss After Achieving Zero Training Error?

International Conference on Machine Learning (ICML), 2020

20 February 2020

Papers citing "Do We Need Zero Training Loss After Achieving Zero Training Error?"

50 / 64 papers shown

A Unified and Stable Risk Minimization Framework for Weakly Supervised Learning with Theoretical Guarantees

157

28 Nov 2025

A Closer Look at Personalized Fine-Tuning in Heterogeneous Federated Learning

Sai Praneeth Karimireddy

Xiaoxiao Li

193

16 Nov 2025

When Data Falls Short: Grokking Below the Critical Threshold

Vaibhav Singh

Eugene Belilovsky

Rahaf Aljundi

134

06 Nov 2025

Rethinking Consistent Multi-Label Classification Under Inexact Supervision

197

05 Oct 2025

Class-wise Flooding Regularization for Imbalanced Image Classification

103

26 Aug 2025

Unpacking the Implicit Norm Dynamics of Sharpness-Aware Minimization in Tensorized Models

Tianxiao Cao

Kyohei Atarashi

H. Kashima

268

14 Aug 2025

Adversarial Defence without Adversarial Defence: Enhancing Language Model Robustness via Instance-level Principal Component Removal

356

29 Jul 2025

Tougher Text, Smarter Models: Raising the Bar for Adversarial Defence BenchmarksInternational Conference on Computational Linguistics (COLING), 2025

Yang Wang

Chenghua Lin

ELM

451

05 Jan 2025

Counter-Current Learning: A Biologically Plausible Dual Network Approach for Deep LearningNeural Information Processing Systems (NeurIPS), 2024

Chia-Hsiang Kao

Bharath Hariharan

360

30 Sep 2024

Making Robust Generalizers Less Rigid with Loss Concentration

Matthew J. Holland

Toma Hamada

OOD

402

07 Aug 2024

ClassiFIM: An Unsupervised Method To Detect Phase Transitions

192

06 Aug 2024

Risks, Causes, and Mitigations of Widespread Deployments of Large Language Models (LLMs): A Survey

Md Athikul Islam

319

01 Aug 2024

Decoupling the Class Label and the Target Concept in Machine Unlearning

Jianliang Xu

Masashi Sugiyama

207

12 Jun 2024

Are AI-Generated Text Detectors Robust to Adversarial Perturbations?

533

03 Jun 2024

GenFighter: A Generative and Evolutive Textual Attack Removal

Md Athikul Islam

Edoardo Serra

Sushil Jajodia

AAML

203

17 Apr 2024

Layer-wise Regularized Dropout for Neural Language Models

Shiwen Ni

Min Yang

Ruifeng Xu

Chengming Li

Xiping Hu

144

26 Feb 2024

Criterion Collapse and Loss Distribution Control

Matthew J. Holland

295

15 Feb 2024

Coupled Confusion Correction: Learning from Crowds with Sparse AnnotationsAAAI Conference on Artificial Intelligence (AAAI), 2023

Shiming Ge

379

12 Dec 2023

A Generalizable Deep Learning System for Cardiac MRI

...

Curtis Langlotz

William Hiesinger

MedIm

253

01 Dec 2023

On the Hyperparameter Loss Landscapes of Machine Learning Models: An Exploratory StudyKnowledge Discovery and Data Mining (KDD), 2023

Mingyu Huang

Ke Li

303

23 Nov 2023

AdaFlood: Adaptive Flood Regularization

Yi Ren

268

06 Nov 2023

Flooding Regularization for Stable Training of Generative Adversarial Networks

328

01 Nov 2023

NECO: NEural Collapse Based Out-of-distribution detectionInternational Conference on Learning Representations (ICLR), 2023

381

10 Oct 2023

Quality-Agnostic Deepfake Detection with Intra-model Collaborative LearningIEEE International Conference on Computer Vision (ICCV), 2023

B. Le

Simon S. Woo

AAML

281

12 Sep 2023

Label Noise: Correcting a Correction

William Toner

Amos Storkey

NoLa

270

24 Jul 2023

DSRM: Boost Textual Adversarial Training with Distribution Shift Risk MinimizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Yan Liu

208

27 Jun 2023

Unleashing Mask: Explore the Intrinsic Out-of-Distribution Detection CapabilityInternational Conference on Machine Learning (ICML), 2023

Jiangchao Yao

Bo Han

233

06 Jun 2023

HUB: Guiding Learned Optimizers with Continuous Prompt Tuning

Gaole Dai

Wei Wu

Ziyu Wang

Jie Fu

Shanghang Zhang

Tiejun Huang

AIFin

244

26 May 2023

Temporal Aware Mixed Attention-based Convolution and Transformer Network (MACTN) for EEG Emotion Recognition

214

18 May 2023

Do Not Blindly Imitate the Teacher: Using Perturbed Loss for Knowledge Distillation

338

08 May 2023

Exploring the Effect of Multi-step Ascent in Sharpness-Aware Minimization

206

27 Jan 2023

A Stability Analysis of Fine-Tuning a Pre-Trained Model

Z. Fu

Anthony Man-Cho So

Nigel Collier

224

24 Jan 2023

$β$-DARTS++: Bi-level Regularization for Proxy-robust Differentiable
Architecture Search

β

-DARTS++: Bi-level Regularization for Proxy-robust Differentiable Architecture SearchIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Peng Ye

Tao Chen

Wanli Ouyang

251

16 Jan 2023

Stability Analysis of Sharpness-Aware Minimization

288

16 Jan 2023

Efficient Generalization Improvement Guided by Random Weight Perturbation

191

21 Nov 2022

Noisy Pairing and Partial Supervision for Opinion SummarizationInternational Conference on Natural Language Generation (INLG), 2022

186

16 Nov 2022

One-Class Risk Estimation for One-Class Hyperspectral Image ClassificationIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2022

Hengwei Zhao

Yanfei Zhong

Xinyu Wang

H. Shu

164

27 Oct 2022

WaveBound: Dynamic Error Bounds for Stable Time Series ForecastingNeural Information Processing Systems (NeurIPS), 2022

265

25 Oct 2022

Stable and Efficient Adversarial Training through Local Linearization

Zhuorong Li

Daiwei Yu

AAML

131

11 Oct 2022

Understanding Gradient Regularization in Deep Learning: Efficient Finite-Difference Computation and Implicit BiasInternational Conference on Machine Learning (ICML), 2022

166

06 Oct 2022

Pre-training General Trajectory Embeddings with Maximum Multi-view Entropy CodingIEEE Transactions on Knowledge and Data Engineering (TKDE), 2022

Yan Lin

216

29 Jul 2022

Multi-class Classification from Multiple Unlabeled Datasets with Partial Risk RegularizationAsian Conference on Machine Learning (ACML), 2022

230

04 Jul 2022

Fairness via In-Processing in the Over-parameterized Regime: A Cautionary Tale

206

29 Jun 2022

Improving robustness of language models from a geometry-aware perspectiveFindings (Findings), 2022

196

28 Apr 2022

Improving Camouflaged Object Detection with the Uncertainty of Pseudo-edge LabelsACM Multimedia Asia (MA), 2021

Nobukatsu Kajiura

Hong Liu

Shiníchi Satoh

181

29 Oct 2021

Anti-Backdoor Learning: Training Clean Models on Poisoned DataNeural Information Processing Systems (NeurIPS), 2021

368

430

22 Oct 2021

On the Generalization of Models Trained with SGD: Information-Theoretic Bounds and Implications

Ziqiao Wang

Yongyi Mao

FedML MLT

331

07 Oct 2021

MutualGraphNet: A novel model for motor imagery classification

127

02 Sep 2021

HAT4RD: Hierarchical Adversarial Training for Rumor Detection on Social MediaItalian National Conference on Sensors (INS), 2021

Shiwen Ni

Jiawen Li

Hung-Yu kao

232

29 Aug 2021

DropAttack: A Masked Weight Adversarial Training Method to Improve Generalization of Neural Networks

158

29 Aug 2021