v1v2v3v4v5 (latest)

Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding

1 October 2015

Song Han

Papers citing "Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding"

50 / 3,629 papers shown

SamurAI: A Versatile IoT Node With Event-Driven Wake-Up and Embedded ML AccelerationIEEE Journal of Solid-State Circuits (JSSC), 2023

...

11 Apr 2023

Conditional Adapters: Parameter-efficient Transfer Learning with Fast InferenceNeural Information Processing Systems (NeurIPS), 2023

Joshua Ainslie

...

220

11 Apr 2023

Model Sparsity Can Simplify Machine UnlearningNeural Information Processing Systems (NeurIPS), 2023

Yang Liu

781

190

11 Apr 2023

Graph Enabled Cross-Domain Knowledge Transfer

S. Yao

156

07 Apr 2023

Tensor Slicing and Optimization for Multicore NPUs

192

06 Apr 2023

Learning to Learn with Indispensable Connections

155

06 Apr 2023

HNeRV: A Hybrid Neural Representation for VideosComputer Vision and Pattern Recognition (CVPR), 2023

Hao Chen

M. Gwilliam

Ser-Nam Lim

Abhinav Shrivastava

141

110

05 Apr 2023

Efficient human-in-loop deep learning model training with iterative refinement and statistical result validation

Manuel Zahn

Douglas P. Perrin

140

03 Apr 2023

Optimizing data-flow in Binary Neural NetworksItalian National Conference on Sensors (INS), 2023

Lorenzo Vorabbi

Davide Maltoni

Stefano Santi

200

03 Apr 2023

SEENN: Towards Temporal Spiking Early-Exit Neural NetworksNeural Information Processing Systems (NeurIPS), 2023

Yuhang Li

Tamar Geller

Youngeun Kim

Priyadarshini Panda

311

02 Apr 2023

A Generative Framework for Low-Cost Result Validation of Machine Learning-as-a-Service InferenceACM Asia Conference on Computer and Communications Security (AsiaCCS), 2023

Abhinav Kumar

Miguel A. Guirao Aguilera

R. Tourani

Satyajayant Misra

AAML

433

31 Mar 2023

BOLT: An Automated Deep Learning Framework for Training and Deploying Large-Scale Search and Recommendation Models on Commodity CPU HardwareInternational Conference on Information and Knowledge Management (CIKM), 2023

...

Anshumali Shrivastava

224

30 Mar 2023

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision TransformerComputer Vision and Pattern Recognition (CVPR), 2023

Xuanyao Chen

Zhijian Liu

Haotian Tang

Li Yi

Hang Zhao

Song Han

ViT

328

30 Mar 2023

Distributed Neural Representation for Reactive in situ VisualizationIEEE Transactions on Visualization and Computer Graphics (TVCG), 2023

172

28 Mar 2023

SwiftFormer: Efficient Additive Attention for Transformer-based Real-time Mobile Vision ApplicationsIEEE International Conference on Computer Vision (ICCV), 2023

Abdelrahman M. Shaker

Salman Khan

317

170

27 Mar 2023

Vision Models Can Be Efficiently Specialized via Few-Shot Task-Aware Compression

Denis Kuznedelev

Dan Alistarh

194

25 Mar 2023

PowerPruning: Selecting Weights and Activations for Power-Efficient Neural Network AccelerationDesign Automation Conference (DAC), 2023

Yiran Chen

24 Mar 2023

Q-HyViT: Post-Training Quantization of Hybrid Vision Transformers with Bridge Block Reconstruction for IoT SystemsIEEE Internet of Things Journal (IEEE IoT J.), 2023

Sihyeong Park

231

22 Mar 2023

Low Rank Optimization for Efficient Deep Learning: Making A Balance between Compact Architecture and Fast TrainingJournal of Systems Engineering and Electronics (JSEE), 2023

204

22 Mar 2023

Performance-aware Approximation of Global Channel Pruning for Multitask CNNsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Tao Chen

140

21 Mar 2023

Solving Oscillation Problem in Post-Training Quantization Through a Theoretical PerspectiveComputer Vision and Pattern Recognition (CVPR), 2023

228

21 Mar 2023

Sparse-IFT: Sparse Iso-FLOP Transformations for Maximizing Training EfficiencyInternational Conference on Machine Learning (ICML), 2023

440

21 Mar 2023

Greedy Pruning with Group Lasso Provably Generalizes for Matrix SensingNeural Information Processing Systems (NeurIPS), 2023

250

20 Mar 2023

ExplainFix: Explainable Spatially Fixed Deep Networks

147

18 Mar 2023

DC-CCL: Device-Cloud Collaborative Controlled Learning for Large Vision Models

176

18 Mar 2023

Unleashing the Potential of Spiking Neural Networks by Dynamic ConfidenceIEEE International Conference on Computer Vision (ICCV), 2023

Chen Li

Edward Jones

Steve Furber

343

17 Mar 2023

Iterative Soft Shrinkage Learning for Efficient Image Super-ResolutionIEEE International Conference on Computer Vision (ICCV), 2023

Huan Wang

152

16 Mar 2023

A High-Performance Accelerator for Super-Resolution Processing on Embedded GPU

127

16 Mar 2023

Gated Compression Layers for Efficient Always-On Models

190

15 Mar 2023

R2 Loss: Range Restriction Loss for Model Compression and Quantization

Minsik Cho

137

14 Mar 2023

MetaMixer: A Regularization Strategy for Online Knowledge Distillation

131

14 Mar 2023

FPUS23: An Ultrasound Fetus Phantom Dataset with Deep Neural Network Evaluations for Fetus Orientations, Fetal Planes, and Anatomical FeaturesIEEE Access (IEEE Access), 2023

196

14 Mar 2023

Automatic Attention Pruning: Improving and Automating Model Pruning using AttentionsInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Kaiqi Zhao

Animesh Jain

Ming Zhao

185

14 Mar 2023

AdaptiveNet: Post-deployment Neural Architecture Adaptation for Diverse Edge EnvironmentsACM/IEEE International Conference on Mobile Computing and Networking (MobiCom), 2023

244

13 Mar 2023

Three Guidelines You Should Know for Universally Slimmable Self-Supervised LearningComputer Vision and Pattern Recognition (CVPR), 2023

Yunhao Cao

Peiqin Sun

Shuchang Zhou

111

13 Mar 2023

OTOV2: Automatic, Generic, User-FriendlyInternational Conference on Learning Representations (ICLR), 2023

Tianyi Chen

230

13 Mar 2023

Complement Sparsification: Low-Overhead Model Pruning for Federated LearningAAAI Conference on Artificial Intelligence (AAAI), 2023

Xiaopeng Jiang

Cristian Borcea

FedML

174

10 Mar 2023

Sparse and Local Networks for Hypergraph ReasoningLOG IN (LOG IN), 2023

Guangxuan Xiao

L. Kaelbling

Jiajun Wu

Jiayuan Mao

NAI ReLM LRM

194

09 Mar 2023

A Privacy Preserving System for Movie Recommendations Using Federated Learning

373

07 Mar 2023

An Edge-based WiFi Fingerprinting Indoor Localization Using Convolutional Neural Network and Convolutional Auto-EncoderIEEE Access (IEEE Access), 2023

Amin Kargar-Barzi

Ebrahim Farahmand

Nooshin Taheri Chatrudi

A. Mahani

M. Shafique

152

07 Mar 2023

Training-Free Acceleration of ViTs with Delayed Spatial Merging

279

04 Mar 2023

Adversarial Attacks on Machine Learning in Embedded and IoT Platforms

Christian Westbrook

S. Pasricha

AAML

145

03 Mar 2023

Sparsity May Cry: Let Us Fail (Current) Sparse Neural Networks Together!International Conference on Learning Representations (ICLR), 2023

207

03 Mar 2023

Rotation Invariant Quantization for Model Compression

280

03 Mar 2023

TopSpark: A Timestep Optimization Methodology for Energy-Efficient Spiking Neural Networks on Autonomous Mobile AgentsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

Rachmad Vidya Wicaksana Putra

Mohamed Bennai

182

03 Mar 2023

Distilling Multi-Level X-vector Knowledge for Small-footprint Speaker Verification

Xuechen Liu

Md. Sahidullah

Tomi Kinnunen

274

02 Mar 2023

Learning to Grow Pretrained Models for Efficient Transformer TrainingInternational Conference on Learning Representations (ICLR), 2023

Peihao Wang

Yikang Shen

Lucas Torroba Hennigen

199

02 Mar 2023

EdgeServe: A Streaming System for Decentralized Model Serving

Ted Shaowang

Sanjay Krishnan

202

02 Mar 2023

Structured Pruning for Deep Convolutional Neural Networks: A surveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yang He

Lingao Xiao

3DPC

360

257

01 Mar 2023

GRAN: Ghost Residual Attention Network for Single Image Super Resolution

Qingsen Yan

162

28 Feb 2023