v1v2v3 (latest)

HAQ: Hardware-Aware Automated Quantization with Mixed Precision

Computer Vision and Pattern Recognition (CVPR), 2018

21 November 2018

Zhijian Liu

Song Han

Papers citing "HAQ: Hardware-Aware Automated Quantization with Mixed Precision"

50 / 464 papers shown

PDP: Parameter-free Differentiable Pruning is All You NeedNeural Information Processing Systems (NeurIPS), 2023

Minsik Cho

Saurabh N. Adya

Devang Naik

VLM

250

18 May 2023

Patch-wise Mixed-Precision Quantization of Vision TransformerIEEE International Joint Conference on Neural Network (IJCNN), 2023

Junrui Xiao

Zhikai Li

Lianwei Yang

Qingyi Gu

184

11 May 2023

LayerNAS: Neural Architecture Search in Polynomial Complexity

Xin Wang

154

23 Apr 2023

QuMoS: A Framework for Preserving Security of Quantum Machine Learning ModelInternational Conference on Quantum Computing and Engineering (QCE), 2023

315

23 Apr 2023

Evil from Within: Machine Learning Backdoors through Hardware Trojans

511

17 Apr 2023

Canvas: End-to-End Kernel Architecture Search in Neural Networks

Chenggang Zhao

Genghan Zhang

Mingyu Gao

194

16 Apr 2023

End-to-end codesign of Hessian-aware quantized neural networks for FPGAs and ASICs

Javier Campos

Zhen Dong

Javier Mauricio Duarte

146

13 Apr 2023

Learning Accurate Performance Predictors for Ultrafast Automated Model CompressionInternational Journal of Computer Vision (IJCV), 2023

Jie Zhou

166

13 Apr 2023

AutoQNN: An End-to-End Framework for Automatically Quantizing Neural NetworksJournal of Computational Science and Technology (JCST), 2023

180

07 Apr 2023

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Li Shen

Liang Ding

296

07 Apr 2023

SparseViT: Revisiting Activation Sparsity for Efficient High-Resolution Vision TransformerComputer Vision and Pattern Recognition (CVPR), 2023

Xuanyao Chen

Zhijian Liu

Haotian Tang

Li Yi

Hang Zhao

Song Han

ViT

332

30 Mar 2023

Solving Oscillation Problem in Post-Training Quantization Through a Theoretical PerspectiveComputer Vision and Pattern Recognition (CVPR), 2023

232

21 Mar 2023

Gated Compression Layers for Efficient Always-On Models

193

15 Mar 2023

SpaceEvo: Hardware-Friendly Search Space Design for Efficient INT8 InferenceIEEE International Conference on Computer Vision (ICCV), 2023

Yujing Wang

Yuqing Yang

Ningxin Zheng

Ting Cao

Mao Yang

119

15 Mar 2023

R2 Loss: Range Restriction Loss for Model Compression and Quantization

Minsik Cho

140

14 Mar 2023

MetaMixer: A Regularization Strategy for Online Knowledge Distillation

131

14 Mar 2023

AdaptiveNet: Post-deployment Neural Architecture Adaptation for Diverse Edge EnvironmentsACM/IEEE International Conference on Mobile Computing and Networking (MobiCom), 2023

245

13 Mar 2023

Bag of Tricks with Quantized Convolutional Neural Networks for image classificationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Jie Hu

Mengze Zeng

Enhua Wu

121

13 Mar 2023

TinyAD: Memory-efficient anomaly detection for time series data in Industrial IoTIEEE Transactions on Industrial Informatics (IEEE TII), 2023

Yuting Sun

Tong Chen

Quoc Viet Hung Nguyen

Hongzhi Yin

199

07 Mar 2023

Rotation Invariant Quantization for Model Compression

282

03 Mar 2023

Structured Pruning for Deep Convolutional Neural Networks: A surveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yang He

Lingao Xiao

3DPC

361

261

01 Mar 2023

DyBit: Dynamic Bit-Precision Numbers for Efficient Quantized Neural Network InferenceIEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (IEEE TCAD), 2023

203

24 Feb 2023

Towards Optimal Compression: Joint Pruning and Quantization

322

15 Feb 2023

SEAM: Searching Transferable Mixed-Precision Quantization Policy through Large Margin RegularizationACM Multimedia (ACM MM), 2023

Chen Tang

173

14 Feb 2023

A Practical Mixed Precision Algorithm for Post-Training Quantization

189

10 Feb 2023

Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

190

09 Feb 2023

DynaMIX: Resource Optimization for DNN-Based Real-Time Applications on a Multi-Tasking System

Minkyoung Cho

Kang G. Shin

03 Feb 2023

Mixed Precision Post Training Quantization of Neural Networks with Sensitivity Guided Search

Clemens J. S. Schaefer

Navid Lambert-Shirzad

239

02 Feb 2023

$$\rm A^2Q$: Aggregation-Aware Quantization for Graph Neural Networks$

\rm A^2Q

: Aggregation-Aware Quantization for Graph Neural NetworksInternational Conference on Learning Representations (ICLR), 2023

200

01 Feb 2023

Efficient and Effective Methods for Mixed Precision Neural Network Quantization for Faster, Energy-efficient Inference

307

30 Jan 2023

Does Federated Learning Really Need Backpropagation?European Conference on Computer Vision (ECCV), 2023

272

28 Jan 2023

Tailor: Altering Skip Connections for Resource-Efficient InferenceACM Transactions on Reconfigurable Technology and Systems (TRETS), 2023

Vladimir Loncar

Javier Mauricio Duarte

Ryan Kastner

211

18 Jan 2023

Hyperspherical Quantization: Toward Smaller and More Accurate ModelsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Dan Liu

X. Chen

Chen Ma

Xue Liu

179

24 Dec 2022

Hyperspherical Loss-Aware Ternary Quantization

Dan Liu

Xue Liu

164

24 Dec 2022

Automatic Network Adaptation for Ultra-Low Uniform-Precision Quantization

272

21 Dec 2022

CSMPQ:Class Separability Based Mixed-Precision QuantizationInternational Conference on Intelligent Computing (ICIC), 2022

131

20 Dec 2022

RepQ-ViT: Scale Reparameterization for Post-Training Quantization of Vision TransformersIEEE International Conference on Computer Vision (ICCV), 2022

Zhikai Li

Junrui Xiao

Lianwei Yang

Qingyi Gu

321

132

16 Dec 2022

NAWQ-SR: A Hybrid-Precision NPU Engine for Efficient On-Device Super-ResolutionIEEE Transactions on Mobile Computing (IEEE TMC), 2022

Stylianos I. Venieris

Mario Almeida

Royson Lee

Nicholas D. Lane

SupR

265

15 Dec 2022

Towards Hardware-Specific Automatic Compression of Neural Networks

Torben Krieger

Bernhard Klein

Holger Fröning

151

15 Dec 2022

PD-Quant: Post-Training Quantization based on Prediction Difference MetricComputer Vision and Pattern Recognition (CVPR), 2022

502

14 Dec 2022

Vertical Layering of Quantized Neural Networks for Heterogeneous InferenceIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Xiaojuan Qi

209

10 Dec 2022

CSQ: Growing Mixed-Precision Quantization Scheme with Bi-level Continuous SparsificationDesign Automation Conference (DAC), 2022

Lirui Xiao

Huanrui Yang

Zhen Dong

Kurt Keutzer

Li Du

Shanghang Zhang

167

06 Dec 2022

Make RepVGG Greater Again: A Quantization-aware ApproachAAAI Conference on Artificial Intelligence (AAAI), 2022

Xiangxiang Chu

Liang Li

Bo Zhang

306

03 Dec 2022

Boosted Dynamic Neural NetworksAAAI Conference on Artificial Intelligence (AAAI), 2022

Gao Huang

183

30 Nov 2022

Class-based Quantization for Neural NetworksDesign, Automation and Test in Europe (DATE), 2022

151

27 Nov 2022

MPCViT: Searching for Accurate and Efficient MPC-Friendly Vision Transformer with Heterogeneous AttentionIEEE International Conference on Computer Vision (ICCV), 2022

314

25 Nov 2022

NeuMap: Neural Coordinate Mapping by Auto-Transdecoder for Camera LocalizationComputer Vision and Pattern Recognition (CVPR), 2022

153

21 Nov 2022

SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language ModelsInternational Conference on Machine Learning (ICML), 2022

Song Han

800

1,187

18 Nov 2022

Efficient Spatially Sparse Inference for Conditional GANs and Diffusion ModelsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Song Han

Jun-Yan Zhu

DiffM

497

03 Nov 2022

QuaLA-MiniLM: a Quantized Length Adaptive MiniLM

288

31 Oct 2022