Balanced Quantization: An Effective and Efficient Approach to Quantized
Neural Networks

Balanced Quantization: An Effective and Efficient Approach to Quantized Neural Networks

22 June 2017

Shuchang Zhou

Papers citing "Balanced Quantization: An Effective and Efficient Approach to Quantized Neural Networks"

16 / 16 papers shown

Title
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs Armand Foucault Franck Mamalet François Malgouyres MQ 74 0 0 28 Jan 2025
COAT: Compressing Optimizer states and Activation for Memory-Efficient FP8 Training Haocheng Xi Han Cai Ligeng Zhu Y. Lu Kurt Keutzer Jianfei Chen Song Han MQ 63 9 0 25 Oct 2024
CBQ: Cross-Block Quantization for Large Language Models Xin Ding Xiaoyu Liu Zhijun Tu Yun-feng Zhang Wei Li ... Hanting Chen Yehui Tang Zhiwei Xiong Baoqun Yin Yunhe Wang MQ 27 13 0 13 Dec 2023
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks Cheng Gong Ye Lu Surong Dai Deng Qian Chenkun Du Tao Li MQ 27 0 0 07 Apr 2023
Deep learning model compression using network sensitivity and gradients M. Sakthi N. Yadla Raj Pawate 16 2 0 11 Oct 2022
Limitations of neural network training due to numerical instability of backpropagation Clemens Karner V. Kazeev P. Petersen 32 3 0 03 Oct 2022
Stochastic Precision Ensemble: Self-Knowledge Distillation for Quantized Deep Neural Networks Yoonho Boo Sungho Shin Jungwook Choi Wonyong Sung MQ 14 29 0 30 Sep 2020
Exploring the Connection Between Binary and Spiking Neural Networks Sen Lu Abhronil Sengupta MQ 14 100 0 24 Feb 2020
Towards Efficient Training for Neural Network Quantization Qing Jin Linjie Yang Zhenyu A. Liao MQ 11 42 0 21 Dec 2019
Differentiable Soft Quantization: Bridging Full-Precision and Low-Bit Neural Networks Ruihao Gong Xianglong Liu Shenghu Jiang Tian-Hao Li Peng Hu Jiazhen Lin F. Yu Junjie Yan MQ 21 445 0 14 Aug 2019
GDRQ: Group-based Distribution Reshaping for Quantization Haibao Yu Tuopu Wen Guangliang Cheng Jiankai Sun Qi Han Jianping Shi MQ 25 3 0 05 Aug 2019
Constructing Energy-efficient Mixed-precision Neural Networks through Principal Component Analysis for Edge Intelligence I. Chakraborty Deboleena Roy Isha Garg Aayush Ankit Kaushik Roy 19 37 0 04 Jun 2019
Bridging the Accuracy Gap for 2-bit Quantized Neural Networks (QNN) Jungwook Choi P. Chuang Zhuo Wang Swagath Venkataramani Vijayalakshmi Srinivasan K. Gopalakrishnan MQ 11 75 0 17 Jul 2018
FINN-L: Library Extensions and Design Trade-off Analysis for Variable Precision LSTM Networks on FPGAs Vladimir Rybalkin Alessandro Pappalardo M. M. Ghaffar Giulio Gambardella Norbert Wehn Michaela Blott 11 72 0 11 Jul 2018
Accelerating CNN inference on FPGAs: A Survey K. Abdelouahab Maxime Pelcat Jocelyn Serot F. Berry AI4CE 19 147 0 26 May 2018
PACT: Parameterized Clipping Activation for Quantized Neural Networks Jungwook Choi Zhuo Wang Swagath Venkataramani P. Chuang Vijayalakshmi Srinivasan K. Gopalakrishnan MQ 11 936 0 16 May 2018