v1v2 (latest)

Dynamic Network Surgery for Efficient DNNs

Neural Information Processing Systems (NeurIPS), 2016

16 August 2016

Yiwen Guo

Anbang Yao

Yurong Chen

ArXiv (abs)PDF HTML Github (186★)

Papers citing "Dynamic Network Surgery for Efficient DNNs"

50 / 476 papers shown

Efficient Neural Networks with Discrete Cosine Transform Activations

05 Nov 2025

Fast and accurate neural reflectance transformation imaging through knowledge distillation

297

28 Oct 2025

Compress to Impress: Efficient LLM Adaptation Using a Single Gradient Step on 100 Samples

151

23 Oct 2025

Convergence, design and training of continuous-time dropout as a random batch method

Antonio Álvarez-López

Martín Hernández

133

15 Oct 2025

SQS: Bayesian DNN Compression through Sparse Quantized Sub-distributions

254

10 Oct 2025

CAST: Continuous and Differentiable Semi-Structured Sparsity-Aware Training for Large Language Models

142

30 Sep 2025

DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models

139

26 Sep 2025

Efficient Reinforcement Learning by Reducing Forgetting with Elephant Activation Functions

166

23 Sep 2025

LinDeps: A Fine-tuning Free Post-Pruning Method to Remove Layer-Wise Linear Dependencies with Guaranteed Performance Preservation

Maxim Henry

Adrien Deliège

A. Cioppa

Marc Van Droogenbroeck

VLM

194

29 Jul 2025

Knowledge Grafting: A Mechanism for Optimizing AI Model Deployment in Resource-Constrained Environments

262

25 Jul 2025

Search-Optimized Quantization in Biomedical Ontology AlignmentFrontiers in Artificial Intelligence (Front. Artif. Intell.), 2025

Oussama Bouaggad

Natalia Grabar

227

18 Jul 2025

A geometric framework for momentum-based optimizers for low-rank training

269

20 Jun 2025

Sparse-Reg: Improving Sample Complexity in Offline Reinforcement Learning using Sparsity

286

20 Jun 2025

Hyperpruning: Efficient Search through Pruned Variants of Recurrent Neural Networks Leveraging Lyapunov Spectrum

Caleb Zheng

Eli Shlizerman

215

09 Jun 2025

Frugal Machine Learning for Energy-efficient, and Resource-aware Artificial Intelligence

John Violos

Konstantina-Christina Diamanti

I. Kompatsiaris

Symeon Papadopoulos

261

02 Jun 2025

$Global Minimizers of $\ell^p$-Regularized Objectives Yield the Sparsest ReLU Neural Networks$

Global Minimizers of

\ell^p

-Regularized Objectives Yield the Sparsest ReLU Neural Networks

Julia B. Nakhleh

Robert D. Nowak

351

27 May 2025

You Don't Need All Attentions: Distributed Dynamic Fine-Tuning for Foundation Models

259

16 Apr 2025

Generative Artificial Intelligence for Internet of Things Computing: A Systematic Survey

Fabrizio Mangione

Claudio Savaglio

Giancarlo Fortino

330

10 Apr 2025

Lipschitz Constant Meets Condition Number: Learning Robust and Compact Deep Neural Networks

368

26 Mar 2025

Optimal Brain ApoptosisInternational Conference on Learning Representations (ICLR), 2025

487

25 Feb 2025

HASSLE-free: A unified Framework for Sparse plus Low-Rank Matrix Decomposition for LLMs

186

02 Feb 2025

Deriving Coding-Specific Sub-Models from LLMs using Resource-Efficient Pruning

258

10 Jan 2025

Pruning-based Data Selection and Network Fusion for Efficient Deep Learning

Humaira Kousar

Hasnain Irshad Bhatti

Jaekyun Moon

428

03 Jan 2025

On the Compression of Language Models for Code: An Empirical Study on CodeBERTIEEE International Conference on Software Analysis, Evolution, and Reengineering (SANER), 2024

284

18 Dec 2024

MOFHEI: Model Optimizing Framework for Fast and Efficient Homomorphically Encrypted Neural Network InferenceInternational Conference on Trust, Privacy and Security in Intelligent Systems and Applications (ICPSISA), 2024

293

10 Dec 2024

Efficient Model Compression for Bayesian Neural Networks

278

01 Nov 2024

Neuralink: Fast LLM Inference on Smartphones with Neuron Co-Activation Linking

421

25 Oct 2024

GeoLoRA: Geometric integration for parameter efficient fine-tuningInternational Conference on Learning Representations (ICLR), 2024

285

24 Oct 2024

SGLP: A Similarity Guided Fast Layer Partition Pruning for Compressing Large Deep Models

255

14 Oct 2024

CNN Mixture-of-DepthsAsian Conference on Computer Vision (ACCV), 2024

Rinor Cakaj

Jens Mehnert

Bin Yang

306

25 Sep 2024

Learning effective pruning at initialization from iterative pruning

Fusheng Zha

371

27 Aug 2024

An Effective Information Theoretic Framework for Channel Pruning

Yihao Chen

Zefang Wang

347

14 Aug 2024

LeanQuant: Accurate and Scalable Large Language Model Quantization with Loss-error-aware Grid

Tianyi Zhang

Anshumali Shrivastava

386

14 Jul 2024

MagMax: Leveraging Model Merging for Seamless Continual Learning

Daniel Marczak

Bartłomiej Twardowski

Tomasz Trzciñski

Sebastian Cygert

MoMe CLL

250

08 Jul 2024

Data Overfitting for On-Device Super-Resolution with Dynamic Algorithm and Compiler Co-Design

Gen Li

395

03 Jul 2024

ALPS: Improved Optimization for Highly Sparse One-Shot Pruning for Large Language Models

333

12 Jun 2024

Sparse Bayesian Networks: Efficient Uncertainty Quantification in Medical Image Analysis

278

11 Jun 2024

Reinforced Compressive Neural Architecture Search for Versatile Adversarial Robustness

281

10 Jun 2024

PaRa: Personalizing Text-to-Image Diffusion via Parameter Rank ReductionInternational Conference on Learning Representations (ICLR), 2024

258

09 Jun 2024

Quantifying Task Priority for Multi-Task Optimization

Wooseong Jeong

Kuk-Jin Yoon

339

05 Jun 2024

Diverse Subset Selection via Norm-Based Sampling and Orthogonality

Noga Bar

Raja Giryes

CVBM

421

03 Jun 2024

Effective Interplay between Sparsity and Quantization: From Theory to Practice

...

451

31 May 2024

Data-independent Module-aware Pruning for Hierarchical Vision Transformers

Yang He

Qiufeng Wang

ViT

319

21 Apr 2024

Lightweight Deep Learning for Resource-Constrained Environments: A Survey

428

206

08 Apr 2024

DRIVE: Dual Gradient-Based Rapid Iterative Pruning

Dhananjay Saikumar

Blesson Varghese

273

01 Apr 2024

Separate, Dynamic and Differentiable (SMART) Pruner for Block/Output Channel Pruning on Computer Vision Tasks

231

29 Mar 2024

ALISA: Accelerating Large Language Model Inference via Sparsity-Aware KV Caching

Youpeng Zhao

Di Wu

Jun Wang

302

26 Mar 2024

OSSCAR: One-Shot Structured Pruning in Vision and Language Models with Combinatorial Optimization

442

02 Mar 2024

MGE: A Training-Free and Efficient Model Generation and Enhancement Scheme

162

27 Feb 2024

NeuroFlux: Memory-Efficient CNN Training Using Adaptive Local Learning

Dhananjay Saikumar

Blesson Varghese

277

21 Feb 2024