v1v2 (latest)

BitPruning: Learning Bitlengths for Aggressive and Accurate Quantization

International Symposium on Circuits and Systems (ISCAS), 2020

8 February 2020

Milovs Nikolić

G. B. Hacene

Ciaran Bannon

Alberto Delmas Lascorz

Vincent Gripon

Papers citing "BitPruning: Learning Bitlengths for Aggressive and Accurate Quantization"

16 / 16 papers shown

AdaQAT: Adaptive Bit-Width Quantization-Aware Training

223

22 Apr 2024

CNN-Based Equalization for Communications: Achieving Gigabit Throughput with a Flexible FPGA Hardware Architecture

212

22 Apr 2024

Free Bits: Latency Optimization of Mixed-Precision Quantized Neural Networks on the EdgeInternational Conference on Artificial Intelligence Circuits and Systems (ICAICS), 2023

Georg Rutishauser

Francesco Conti

Luca Benini

280

06 Jul 2023

Unsupervised ANN-Based Equalizer and Its Trainable FPGA Implementation

253

14 Apr 2023

Efficient and Effective Methods for Mixed Precision Neural Network Quantization for Faster, Energy-efficient Inference

325

30 Jan 2023

FullPack: Full Vector Utilization for Sub-Byte Quantized Inference on General Purpose CPUs

Hossein Katebi

Navidreza Asadi

M. Goudarzi

174

13 Nov 2022

SDQ: Stochastic Differentiable Quantization with Mixed PrecisionInternational Conference on Machine Learning (ICML), 2022

473

09 Jun 2022

A Low Memory Footprint Quantized Neural Network for Depth Completion of Very Sparse Time-of-Flight Depth Maps

207

25 May 2022

A Silicon Photonic Accelerator for Convolutional Neural Networks with Heterogeneous QuantizationACM Great Lakes Symposium on VLSI (GLSVLSI), 2022

Febin P. Sunny

Mahdi Nikdast

S. Pasricha

165

17 May 2022

A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image ClassificationACM Transactions on Intelligent Systems and Technology (ACM TIST), 2022

Babak Rokh

A. Azarpeyvand

Alireza Khanteymoori

512

205

14 May 2022

Schrödinger's FP: Dynamic Adaptation of Floating-Point Containers for Deep Learning Training

Milovs Nikolić

Enrique Torres Sanchez

318

28 Apr 2022

APack: Off-Chip, Lossless Data Compression for Efficient Deep Learning Inference

Alberto Delmas Lascorz

Mostafa Mahmoud

Andreas Moshovos

175

21 Jan 2022

Quantization and Deployment of Deep Neural Networks on MicrocontrollersItalian National Conference on Sensors (INS), 2021

Pierre-Emmanuel Novac

G. B. Hacene

Alain Pegatoquet

Benoit Miramond

Vincent Gripon

244

166

27 May 2021

DNN Quantization with Attention

198

24 Mar 2021

DecisiveNets: Training Deep Associative Memories to Solve Complex Machine Learning Problems

Vincent Gripon

Carlos Lassance

G. B. Hacene

163

02 Dec 2020

FracBits: Mixed Precision Quantization via Fractional Bit-Widths

Linjie Yang

Qing Jin

299

04 Jul 2020