v1v2v3v4 (latest)

Loss Surfaces, Mode Connectivity, and Fast Ensembling of DNNs

Neural Information Processing Systems (NeurIPS), 2018

27 February 2018

Dmitry Vetrov

Papers citing "Loss Surfaces, Mode Connectivity, and Fast Ensembling of DNNs"

50 / 548 papers shown

Domain Aligned Prefix Averaging for Domain Generalization in Abstractive SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

235

26 May 2023

How to escape sharp minima with random perturbationsInternational Conference on Machine Learning (ICML), 2023

418

25 May 2023

Sparse Weight Averaging with Multiple Particles for Iterative Magnitude PruningInternational Conference on Learning Representations (ICLR), 2023

267

24 May 2023

Transferring Learning Trajectories of Neural NetworksInternational Conference on Learning Representations (ICLR), 2023

Daiki Chijiwa

265

23 May 2023

Neural Functional TransformersNeural Information Processing Systems (NeurIPS), 2023

J. Zico Kolter

252

22 May 2023

Annealing Self-Distillation Rectification Improves Adversarial TrainingInternational Conference on Learning Representations (ICLR), 2023

270

20 May 2023

Mode Connectivity in Auction DesignNeural Information Processing Systems (NeurIPS), 2023

Christoph Hertrich

Yixin Tao

László A. Végh

289

18 May 2023

Recyclable Tuning for Continual Pre-trainingAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Yujia Qin

Cheng Qian

Xu Han

Yankai Lin

Huadong Wang

Ruobing Xie

Zhiyuan Liu

Maosong Sun

Jie Zhou

CLL

170

15 May 2023

Understanding and Improving Model Averaging in Federated Learning on Heterogeneous DataIEEE Transactions on Mobile Computing (IEEE TMC), 2023

388

13 May 2023

Functional Equivalence and Path Connectivity of Reducible Hyperbolic Tangent NetworksNeural Information Processing Systems (NeurIPS), 2023

Matthew Farrugia-Roberts

216

08 May 2023

Adaptive loose optimization for robust question answering

Pinghui Wang

Jun Liu

409

06 May 2023

ZipIt! Merging Models from Different Tasks without TrainingInternational Conference on Learning Representations (ICLR), 2023

465

163

04 May 2023

$π$-Tuning: Transferring Multimodal Foundation Models with Optimal
Multi-task Interpolation

π

-Tuning: Transferring Multimodal Foundation Models with Optimal Multi-task InterpolationInternational Conference on Machine Learning (ICML), 2023

Zeyu Lu

Ying Shan

Ping Luo

MoMe

214

27 Apr 2023

PopulAtion Parameter Averaging (PAPA)

Alexia Jolicoeur-Martineau

483

06 Apr 2023

Inductive biases in deep learning models for weather prediction

...

299

06 Apr 2023

Towards Efficient MCMC Sampling in Bayesian Neural Networks by Exploiting Symmetry

Stephan Günnemann

195

06 Apr 2023

On the Variance of Neural Network Training with respect to Test Sets and DistributionsInternational Conference on Learning Representations (ICLR), 2023

Keller Jordan

OOD

366

04 Apr 2023

A Survey of Historical Learning: Learning Models with Learning History

Xiang Li

Lingfeng Yang

Jian Yang

248

23 Mar 2023

Sharpness-Aware Gradient Matching for Domain GeneralizationComputer Vision and Pattern Recognition (CVPR), 2023

Pengfei Wang

Zhaoxiang Zhang

Zhen Lei

Lei Zhang

285

143

18 Mar 2023

Bridging Models to Defend: A Population-Based Strategy for Robust Adversarial Defense

Mohammad Shahidehpour

Alfred Hero

AAML

184

17 Mar 2023

Achieving a Better Stability-Plasticity Trade-off via Auxiliary Networks in Continual LearningComputer Vision and Pattern Recognition (CVPR), 2023

Antonio Orvieto

171

16 Mar 2023

To Stay or Not to Stay in the Pre-train Basin: Insights on Ensembling in Transfer LearningNeural Information Processing Systems (NeurIPS), 2023

Ildus Sadrtdinov

Dmitrii Pozdeev

Dmitry Vetrov

E. Lobacheva

236

06 Mar 2023

Average of Pruning: Improving Performance and Stability of Out-of-Distribution DetectionIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

210

02 Mar 2023

DART: Diversify-Aggregate-Repeat Training Improves Generalization of Neural NetworksComputer Vision and Pattern Recognition (CVPR), 2023

321

28 Feb 2023

Permutation Equivariant Neural FunctionalsNeural Information Processing Systems (NeurIPS), 2023

J. Zico Kolter

300

27 Feb 2023

Random Teachers are Good TeachersInternational Conference on Machine Learning (ICML), 2023

336

23 Feb 2023

Modular Deep Learning

437

103

22 Feb 2023

Revisiting Weighted Aggregation in Federated Learning with Neural NetworksInternational Conference on Machine Learning (ICML), 2023

327

101

14 Feb 2023

Autoselection of the Ensemble of Convolutional Neural Networks with Second-Order Cone ProgrammingSocial Science Research Network (SSRN), 2023

Buse Çisil Güldoğuş

Abdullah Nazhat Abdullah

Muhammad Ammar Ali

Süreyya Özögür-Akyüz

132

12 Feb 2023

Interpretable Diversity Analysis: Visualizing Feature Representations In Low-Cost EnsemblesIEEE International Joint Conference on Neural Network (IJCNN), 2023

Tim Whitaker

L. D. Whitley

12 Feb 2023

Knowledge is a Region in Weight Space for Fine-tuned Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

311

09 Feb 2023

Generalized Uncertainty of Deep Neural Networks: Taxonomy and Applications

Chengyu Dong

OOD UQCV BDL AI4CE

333

02 Feb 2023

A Comprehensive Survey of Continual Learning: Theory, Method and ApplicationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Liyuan Wang

Xingxing Zhang

Hang Su

Jun Zhu

KELM CLL

782

1,081

31 Jan 2023

Towards Inference Efficient Deep Ensemble LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

Ziyue Li

Kan Ren

Yifan Yang

Xinyang Jiang

Yuqing Yang

Dongsheng Li

BDL

143

29 Jan 2023

On the Lipschitz Constant of Deep Networks and Double DescentBritish Machine Vision Conference (BMVC), 2023

Matteo Gamba

Hossein Azizpour

Mårten Björkman

542

28 Jan 2023

Uncertainty Estimation based on Geometric Separation

170

11 Jan 2023

Re-basin via implicit Sinkhorn differentiationComputer Vision and Pattern Recognition (CVPR), 2022

318

22 Dec 2022

Likelihood-based generalization of Markov parameter estimation and multiple shooting objectives in system identification

Nicholas Galioto

Alex Arkady Gorodetsky

341

20 Dec 2022

Neuroevolution of Physics-Informed Neural Nets: Benchmark Problems and Comparative Results

Abhishek Gupta

184

15 Dec 2022

Editing Models with Task ArithmeticInternational Conference on Learning Representations (ICLR), 2022

1.2K

740

08 Dec 2022

ColD Fusion: Collaborative Descent for Distributed Multitask FinetuningAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

279

02 Dec 2022

Context-Adaptive Deep Neural Networks via Bridge-Mode Connectivity

178

28 Nov 2022

PAC-Bayes Compression Bounds So Tight That They Can Explain GeneralizationNeural Information Processing Systems (NeurIPS), 2022

Sanyam Kapoor

205

24 Nov 2022

Building a Subspace of Policies for Scalable Continual LearningInternational Conference on Learning Representations (ICLR), 2022

364

18 Nov 2022

Weighted Ensemble Self-Supervised LearningInternational Conference on Learning Representations (ICLR), 2022

Sergey Ioffe

227

18 Nov 2022

Mechanistic Mode ConnectivityInternational Conference on Machine Learning (ICML), 2022

299

15 Nov 2022

REPAIR: REnormalizing Permuted Activations for Interpolation RepairInternational Conference on Learning Representations (ICLR), 2022

417

116

15 Nov 2022

On the Performance of Direct Loss Minimization for Bayesian Neural Networks

Yadi Wei

Roni Khardon

BDL

103

15 Nov 2022

Robust Federated Learning against both Data Heterogeneity and Poisoning Attack via Aggregation Optimization

Weizhong Zhang

Xing Xie

193

10 Nov 2022

Quantifying Model Uncertainty for Semantic Segmentation using Operators in the RKHS

Rishabh Singh

José C. Príncipe

UQCV

180

03 Nov 2022