Improving Post Training Neural Quantization: Layer-wise Calibration and Integer Programming

14 June 2020

Papers citing "Improving Post Training Neural Quantization: Layer-wise Calibration and Integer Programming"

22 / 72 papers shown

Title
Energy awareness in low precision neural networks Nurit Spingarn-Eliezer Ron Banner Elad Hoffer Hilla Ben-Yaacov T. Michaeli 38 0 0 06 Feb 2022
Post-training Quantization for Neural Networks with Provable Guarantees Jinjie Zhang Yixuan Zhou Rayan Saab MQ 15 31 0 26 Jan 2022
UWC: Unit-wise Calibration Towards Rapid Network Compression Chen Lin Zheyang Li Bo Peng Haoji Hu Wenming Tan Ye Ren Shiliang Pu MQ 19 1 0 17 Jan 2022
Edge-Cloud Polarization and Collaboration: A Comprehensive Survey for AI Jiangchao Yao Shengyu Zhang Yang Yao Feng Wang Jianxin Ma ... Kun Kuang Chao-Xiang Wu Fei Wu Jingren Zhou Hongxia Yang 16 91 0 11 Nov 2021
MQBench: Towards Reproducible and Deployable Model Quantization Benchmark Yuhang Li Mingzhu Shen Jian Ma Yan Ren Mingxin Zhao Qi Zhang Ruihao Gong F. Yu Junjie Yan MQ 35 49 0 05 Nov 2021
Arch-Net: Model Distillation for Architecture Agnostic Model Deployment Weixin Xu Zipeng Feng Shuangkang Fang Song Yuan Yi Yang Shuchang Zhou MQ 16 1 0 01 Nov 2021
PTQ-SL: Exploring the Sub-layerwise Post-training Quantization Zhihang Yuan Yiqi Chen Chenhao Xue Chenguang Zhang Qiankun Wang Guangyu Sun MQ 11 3 0 15 Oct 2021
Towards Efficient Post-training Quantization of Pre-trained Language Models Haoli Bai Lu Hou Lifeng Shang Xin Jiang Irwin King M. Lyu MQ 71 47 0 30 Sep 2021
HPTQ: Hardware-Friendly Post Training Quantization H. Habi Reuven Peretz Elad Cohen Lior Dikstein Oranit Dror I. Diamant Roy H. Jennings Arnon Netzer MQ 26 8 0 19 Sep 2021
Fine-grained Data Distribution Alignment for Post-Training Quantization Yunshan Zhong Mingbao Lin Mengzhao Chen Ke Li Yunhang Shen Fei Chao Yongjian Wu Rongrong Ji MQ 81 19 0 09 Sep 2021
Quantization of Generative Adversarial Networks for Efficient Inference: a Methodological Study Pavel Andreev Alexander Fritzler Dmitry Vetrov MQ 11 10 0 31 Aug 2021
Rethinking "Batch" in BatchNorm Yuxin Wu Justin Johnson BDL 29 66 0 17 May 2021
Post-training deep neural network pruning via layer-wise calibration Ivan Lazarevich Alexander Kozlov Nikita Malinin 3DPC 8 25 0 30 Apr 2021
Accelerated Sparse Neural Training: A Provable and Efficient Method to Find N:M Transposable Masks Itay Hubara Brian Chmiel Moshe Island Ron Banner S. Naor Daniel Soudry 44 110 0 16 Feb 2021
Confounding Tradeoffs for Neural Network Quantization Sahaj Garg Anirudh Jain Joe Lou Mitchell Nahmias MQ 21 17 0 12 Feb 2021
Dynamic Precision Analog Computing for Neural Networks Sahaj Garg Joe Lou Anirudh Jain Mitchell Nahmias 37 32 0 12 Feb 2021
BRECQ: Pushing the Limit of Post-Training Quantization by Block Reconstruction Yuhang Li Ruihao Gong Xu Tan Yang Yang Peng Hu Qi Zhang F. Yu Wei Wang Shi Gu MQ 14 414 0 10 Feb 2021
Exploring Neural Networks Quantization via Layer-Wise Quantization Analysis Shachar Gluska Mark Grobman MQ 12 5 0 15 Dec 2020
HAWQV3: Dyadic Neural Network Quantization Z. Yao Zhen Dong Zhangcheng Zheng A. Gholami Jiali Yu ... Leyuan Wang Qijing Huang Yida Wang Michael W. Mahoney Kurt Keutzer MQ 6 87 0 20 Nov 2020
Post-Training BatchNorm Recalibration Gil Shomron U. Weiser 9 2 0 12 Oct 2020
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights Aojun Zhou Anbang Yao Yiwen Guo Lin Xu Yurong Chen MQ 311 1,047 0 10 Feb 2017
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Z. Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 716 6,743 0 26 Sep 2016