v1v2v3v4v5 (latest)

Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

1 October 2015

Song Han

Papers citing "Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding"

50 / 3,629 papers shown

Distributed Machine Learning for UAV Swarms: Computing, Sensing, and SemanticsIEEE Internet of Things Journal (IEEE IoT J.), 2023

195

03 Jan 2023

SAFEMYRIDES: Application of Decentralized Control Edge-Computing to Ridesharing Monitoring Services

S. Elnagar

Manoj A. Thomas

Kweku-Muata A. Osei-Bryson

125

02 Jan 2023

SparseGPT: Massive Language Models Can Be Accurately Pruned in One-ShotInternational Conference on Machine Learning (ICML), 2023

Elias Frantar

Dan Alistarh

VLM

560

1,037

02 Jan 2023

Holistic Network Virtualization and Pervasive Network Intelligence for 6GIEEE Communications Surveys and Tutorials (COMST), 2023

296

291

02 Jan 2023

Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via Deep Reinforcement LearningIEEE Transactions on Industrial Informatics (TII), 2021

Peng Yang

236

128

31 Dec 2022

FlatENN: Train Flat for Enhanced Fault Tolerance of Quantized Deep Neural Networks

Akul Malhotra

S. Gupta

103

29 Dec 2022

QuickNets: Saving Training and Preventing Overconfidence in Early-Exit Neural Architectures

Devdhar Patel

H. Siegelmann

OnRL

190

25 Dec 2022

Hyperspherical Quantization: Toward Smaller and More Accurate ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Dan Liu

X. Chen

Chen Ma

Xue Liu

179

24 Dec 2022

Pruning On-the-Fly: A Recoverable Pruning Method without Fine-tuning

Danyang Liu

Xue Liu

131

24 Dec 2022

Hyperspherical Loss-Aware Ternary Quantization

Dan Liu

Xue Liu

164

24 Dec 2022

Exploring Content Relationships for Distilling Efficient GANs

160

21 Dec 2022

Redistribution of Weights and Activations for AdderNet QuantizationNeural Information Processing Systems (NeurIPS), 2022

252

20 Dec 2022

The case for 4-bit precision: k-bit Inference Scaling LawsInternational Conference on Machine Learning (ICML), 2022

Tim Dettmers

Luke Zettlemoyer

376

287

19 Dec 2022

Training Lightweight Graph Convolutional Networks with Phase-field Models

H. Sahbi

150

19 Dec 2022

FSCNN: A Fast Sparse Convolution Neural Network Inference System

Bo Ji

Tianyi Chen

140

17 Dec 2022

Atrous Space Bender U-Net (ASBU-Net/LogiNet)

Anurag Bansal

O. Ostap

Miguel Maestre Trueba

Kristopher Perry

SSeg

224

16 Dec 2022

Can We Find Strong Lottery Tickets in Generative Models?AAAI Conference on Artificial Intelligence (AAAI), 2022

136

16 Dec 2022

Mod-Squad: Designing Mixture of Experts As Modular Multi-Task Learners

Mingyu Ding

Chuang Gan

124

15 Dec 2022

Towards Hardware-Specific Automatic Compression of Neural Networks

Torben Krieger

Bernhard Klein

Holger Fröning

151

15 Dec 2022

Quant 4.0: Engineering Quantitative Investment with Automated, Explainable and Knowledge-driven Artificial Intelligence

218

13 Dec 2022

ResFed: Communication Efficient Federated Learning by Transmitting Deep Compressed Residuals

186

11 Dec 2022

Statistical guarantees for sparse deep learningAStA Advances in Statistical Analysis (AStA), 2022

Johannes Lederer

145

11 Dec 2022

Vertical Layering of Quantized Neural Networks for Heterogeneous InferenceIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Xiaojuan Qi

209

10 Dec 2022

QVIP: An ILP-based Formal Verification Approach for Quantized Neural NetworksInternational Conference on Automated Software Engineering (ASE), 2022

Jun Sun

165

10 Dec 2022

Optimizing Learning Rate Schedules for Iterative Pruning of Deep Neural Networks

238

09 Dec 2022

Analysis of Deep Learning Architectures and Efficacy of Detecting Forest Fires

Ryan Marinelli

139

08 Dec 2022

Efficient Stein Variational Inference for Reliable Distribution-lossless Network Pruning

205

07 Dec 2022

Slimmable Pruned Neural Networks

Hideaki Kuratsu

Atsuyoshi Nakamura

209

07 Dec 2022

Label-free Knowledge Distillation with Contrastive Loss for Light-weight Speaker RecognitionInternational Symposium on Chinese Spoken Language Processing (ISCSLP), 2022

163

06 Dec 2022

QEBVerif: Quantization Error Bound Verification of Neural NetworksInternational Conference on Computer Aided Verification (CAV), 2022

Yedi Zhang

Fu Song

Jun Sun

303

06 Dec 2022

MobileTL: On-device Transfer Learning with Inverted Residual BlocksAAAI Conference on Artificial Intelligence (AAAI), 2022

206

05 Dec 2022

Distributed Pruning Towards Tiny Neural Networks in Federated LearningIEEE International Conference on Distributed Computing Systems (ICDCS), 2022

216

05 Dec 2022

Exploiting Kernel Compression on BNNsDesign, Automation and Test in Europe (DATE), 2022

Franyell Silfa

J. Arnau

Antonio González

170

01 Dec 2022

Boosted Dynamic Neural NetworksAAAI Conference on Artificial Intelligence (AAAI), 2022

Gao Huang

183

30 Nov 2022

Compressing Volumetric Radiance Fields to 1 MBComputer Vision and Pattern Recognition (CVPR), 2022

170

29 Nov 2022

NoisyQuant: Noisy Bias-Enhanced Post-Training Activation Quantization for Vision TransformersComputer Vision and Pattern Recognition (CVPR), 2022

Yijiang Liu

Huanrui Yang

Zhen Dong

Kurt Keutzer

Li Du

Shanghang Zhang

233

29 Nov 2022

Feature-domain Adaptive Contrastive Distillation for Efficient Single Image Super-ResolutionIEEE Access (IEEE Access), 2022

Hye-Min Moon

Jinwoo Jeong

Sungjei Kim

205

29 Nov 2022

On the Effectiveness of Parameter-Efficient Fine-TuningAAAI Conference on Artificial Intelligence (AAAI), 2022

Haoran Yang

214

204

28 Nov 2022

AcceRL: Policy Acceleration Framework for Deep Reinforcement Learning

Hongjie Zhang

OffRL

124

28 Nov 2022

Class-based Quantization for Neural NetworksDesign, Automation and Test in Europe (DATE), 2022

151

27 Nov 2022

SteppingNet: A Stepping Neural Network with Incremental Accuracy EnhancementDesign, Automation and Test in Europe (DATE), 2022

137

27 Nov 2022

Diffusion Probabilistic Model Made SlimComputer Vision and Pattern Recognition (CVPR), 2022

322

131

27 Nov 2022

Medical Image Segmentation Review: The success of U-NetIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Reza Azad

Ehsan Khodapanah Aghdam

Sanaz Karimijafarbigloo

277

637

27 Nov 2022

Fast and Efficient Malware Detection with Joint Static and Dynamic Features Through Transfer LearningInternational Conference on Applied Cryptography and Network Security (ACNS), 2022

25 Nov 2022

Signed Binary Weight Networks

Sachit Kuhar

Alexey Tumanov

Judy Hoffman

322

25 Nov 2022

PAC-Bayes Compression Bounds So Tight That They Can Explain GeneralizationNeural Information Processing Systems (NeurIPS), 2022

Sanyam Kapoor

202

24 Nov 2022

Structural Knowledge Distillation for Object DetectionNeural Information Processing Systems (NeurIPS), 2022

190

23 Nov 2022

Join the High Accuracy Club on ImageNet with A Binary Neural Network Ticket

404

23 Nov 2022

Developmental Plasticity-inspired Adaptive Pruning for Deep Spiking and Artificial Neural NetworksIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Bing Han

Feifei Zhao

Yi Zeng

Guobin Shen

162

23 Nov 2022

FedDCT: Federated Learning of Large Convolutional Neural Networks on Resource Constrained Devices using Divide and Collaborative TrainingIEEE Transactions on Network and Service Management (IEEE TNSM), 2022

261

20 Nov 2022