Quantized Neural Networks: Training Neural Networks with Low Precision Weights and Activations

22 September 2016

Papers citing "Quantized Neural Networks: Training Neural Networks with Low Precision Weights and Activations"

50 / 193 papers shown

Title
ChainMarks: Securing DNN Watermark with Cryptographic Chain Brian Choi Shu Wang Isabelle Choi Kun Sun 46 0 0 08 May 2025
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices Arnab Sanyal Prithwish Mukherjee Gourav Datta Sandeep P. Chinchali MQ 100 0 0 05 May 2025
GranQ: Granular Zero-Shot Quantization with Unified Layer-Channel Awareness Inpyo Hong Youngwan Jo Hyojeong Lee Sunghyun Ahn Sanghyun Park MQ 60 0 0 24 Mar 2025
EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test Yuhui Li Fangyun Wei Chao Zhang Hongyang R. Zhang 115 5 0 03 Mar 2025
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs Armand Foucault Franck Mamalet François Malgouyres MQ 74 0 0 28 Jan 2025
BILLNET: A Binarized Conv3D-LSTM Network with Logic-gated residual architecture for hardware-efficient video inference Van Thien Nguyen William Guicquero Gilles Sicard 3DV MQ 74 2 0 24 Jan 2025
MOGNET: A Mux-residual quantized Network leveraging Online-Generated weights Van Thien Nguyen William Guicquero Gilles Sicard MQ 69 1 0 17 Jan 2025
Histogram-Equalized Quantization for logic-gated Residual Neural Networks Van Thien Nguyen William Guicquero Gilles Sicard MQ 35 1 0 10 Jan 2025
Quantization Meets Reasoning: Exploring LLM Low-Bit Quantization Degradation for Mathematical Reasoning Zhen Li Yupeng Su Runming Yang C. Xie Z. Wang Zhongwei Xie Ngai Wong Hongxia Yang MQ LRM 33 3 0 06 Jan 2025
Unsupervised detection of semantic correlations in big data Santiago Acevedo Alex Rodriguez A. Laio 65 2 0 04 Nov 2024
Improving DNN Modularization via Activation-Driven Training Tuan Ngo Abid Hassan Saad Shafiq Nenad Medvidovic MoMe 23 0 0 01 Nov 2024
Data Generation for Hardware-Friendly Post-Training Quantization Lior Dikstein Ariel Lapid Arnon Netzer H. Habi MQ 113 0 0 29 Oct 2024
MLPerf Power: Benchmarking the Energy Efficiency of Machine Learning Systems from Microwatts to Megawatts for Sustainable AI Arya Tschand Arun Tejusve Raghunath Rajan S. Idgunji Anirban Ghosh J. Holleman ... Rowan Taubitz Sean Zhan Scott Wasson David Kanter Vijay Janapa Reddi 62 3 0 15 Oct 2024
Selective Attention Improves Transformer Yaniv Leviathan Matan Kalman Yossi Matias 49 8 0 03 Oct 2024
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers with Encouraging Inter-Head Attention Similarity Kanghyun Choi Hyeyoon Lee Dain Kwon Sunjong Park Kyuyeun Kim Noseong Park Jinho Lee Jinho Lee MQ 40 1 0 29 Jul 2024
BrowNNe: Brownian Nonlocal Neurons & Activation Functions Sriram Nagaraj Truman Hickok 21 0 0 21 Jun 2024
An Empirical Investigation of Matrix Factorization Methods for Pre-trained Transformers Ashim Gupta Sina Mahdipour Saravani P. Sadayappan Vivek Srikumar 24 2 0 17 Jun 2024
BOLD: Boolean Logic Deep Learning Van Minh Nguyen Cristian Ocampo Aymen Askri Louis Leconte Ba-Hien Tran AI4CE 32 0 0 25 May 2024
SwiftRL: Towards Efficient Reinforcement Learning on Real Processing-In-Memory Systems Kailash Gogineni Sai Santosh Dayapule Juan Gómez Luna Karthikeya Gogineni Peng Wei Tian-Shing Lan Mohammad Sadrosadati Onur Mutlu Guru Venkataramani 42 10 0 07 May 2024
Hard-Thresholding Meets Evolution Strategies in Reinforcement Learning Chengqian Gao William de Vazelhes Hualin Zhang Bin Gu Zhiqiang Xu 46 0 0 02 May 2024
AdaQAT: Adaptive Bit-Width Quantization-Aware Training Cédric Gernigon Silviu-Ioan Filip Olivier Sentieys Clément Coggiola Mickael Bruno 23 2 0 22 Apr 2024
Quantized Embedding Vectors for Controllable Diffusion Language Models Cheng Kang Xinye Chen Yong Hu Daniel Novak 21 0 0 15 Feb 2024
EAGLE: Speculative Sampling Requires Rethinking Feature Uncertainty Yuhui Li Fangyun Wei Chao Zhang Hongyang R. Zhang 31 121 0 26 Jan 2024
Efficient Stitchable Task Adaptation Haoyu He Zizheng Pan Jing Liu Jianfei Cai Bohan Zhuang 24 3 0 29 Nov 2023
Low-bit Quantization for Deep Graph Neural Networks with Smoothness-aware Message Propagation Shuang Wang B. Eravcı Rustam Guliyev Hakan Ferhatosmanoglu GNN MQ 19 6 0 29 Aug 2023
Data-Free Quantization via Mixed-Precision Compensation without Fine-Tuning Jun Chen Shipeng Bai Tianxin Huang Mengmeng Wang Guanzhong Tian Y. Liu MQ 34 18 0 02 Jul 2023
Quantizable Transformers: Removing Outliers by Helping Attention Heads Do Nothing Yelysei Bondarenko Markus Nagel Tijmen Blankevoort MQ 13 88 0 22 Jun 2023
Towards Large-scale Single-shot Millimeter-wave Imaging for Low-cost Security Inspection Liheng Bian Daoyu Li Shuoguang Wang Chun-yuen Teng Huteng Liu Hanwen Xu Xuyang Chang Guoqiang Zhao Shiyong Li Jun Zhang 19 1 0 25 May 2023
A Systematic Literature Review on Hardware Reliability Assessment Methods for Deep Neural Networks Mohammad Hasan Ahmadilivani Mahdi Taheri J. Raik Masoud Daneshtalab M. Jenihhin 26 25 0 09 May 2023
Application of Transformers for Nonlinear Channel Compensation in Optical Systems Behnam Behinaein Hamgini H. Najafi Ali Bakhshali Zhuhong Zhang 11 1 0 25 Apr 2023
AutoQNN: An End-to-End Framework for Automatically Quantizing Neural Networks Cheng Gong Ye Lu Surong Dai Deng Qian Chenkun Du Tao Li MQ 24 0 0 07 Apr 2023
Dual-Attention Neural Transducers for Efficient Wake Word Spotting in Speech Recognition Saumya Yashmohini Sahai Jing Liu Thejaswi Muniyappa Kanthashree Mysore Sathyendra Anastasios Alexandridis ... Ross McGowan Ariya Rastrow Feng-Ju Chang Athanasios Mouchtaris Siegfried Kunzmann 31 5 0 03 Apr 2023
Architecturing Binarized Neural Networks for Traffic Sign Recognition Andreea Postovan Madalina Erascu 17 4 0 27 Mar 2023
Mathematical Challenges in Deep Learning V. Nia Guojun Zhang I. Kobyzev Michael R. Metel Xinlin Li ... S. Hemati M. Asgharian Linglong Kong Wulong Liu Boxing Chen AI4CE VLM 35 1 0 24 Mar 2023
Quantized Low-Rank Multivariate Regression with Random Dithering Junren Chen Yueqi Wang Michael Kwok-Po Ng 19 4 0 22 Feb 2023
A Survey on Efficient Training of Transformers Bohan Zhuang Jing Liu Zizheng Pan Haoyu He Yuetian Weng Chunhua Shen 18 47 0 02 Feb 2023
Efficient On-device Training via Gradient Filtering Yuedong Yang Guihong Li R. Marculescu 31 18 0 01 Jan 2023
Training Integer-Only Deep Recurrent Neural Networks V. Nia Eyyub Sari Vanessa Courville M. Asgharian MQ 34 2 0 22 Dec 2022
Vertical Layering of Quantized Neural Networks for Heterogeneous Inference Hai Wu Ruifei He Hao Hao Tan Xiaojuan Qi Kaibin Huang MQ 19 2 0 10 Dec 2022
Fast Inference from Transformers via Speculative Decoding Yaniv Leviathan Matan Kalman Yossi Matias LRM 44 618 0 30 Nov 2022
Verifying And Interpreting Neural Networks using Finite Automata Marco Salzer Eric Alsmann Florian Bruse M. Lange AAML 14 3 0 02 Nov 2022
Towards Global Neural Network Abstractions with Locally-Exact Reconstruction Edoardo Manino I. Bessa Lucas C. Cordeiro 19 1 0 21 Oct 2022
MotionDeltaCNN: Sparse CNN Inference of Frame Differences in Moving Camera Videos Mathias Parger Chengcheng Tang Thomas Neff Christopher D. Twigg Cem Keskin Robert Y. Wang M. Steinberger 19 6 0 18 Oct 2022
AttTrack: Online Deep Attention Transfer for Multi-object Tracking Keivan Nalaie Rong Zheng VOT 11 4 0 16 Oct 2022
AlphaTuning: Quantization-Aware Parameter-Efficient Adaptation of Large-Scale Pre-Trained Language Models S. Kwon Jeonghoon Kim Jeongin Bae Kang Min Yoo Jin-Hwa Kim Baeseong Park Byeongwook Kim Jung-Woo Ha Nako Sung Dongsoo Lee MQ 21 30 0 08 Oct 2022
Survey: Exploiting Data Redundancy for Optimization of Deep Learning Jou-An Chen Wei Niu Bin Ren Yanzhi Wang Xipeng Shen 21 24 0 29 Aug 2022
Towards Transmission-Friendly and Robust CNN Models over Cloud and Device Chuntao Ding Zhichao Lu F. Xu Vishnu Naresh Boddeti Yidong Li Jiannong Cao 14 14 0 20 Jul 2022
MCTensor: A High-Precision Deep Learning Library with Multi-Component Floating-Point Tao Yu Wen-Ping Guo Jianan Canal Li Tiancheng Yuan Chris De Sa 11 4 0 18 Jul 2022
QReg: On Regularization Effects of Quantization Mohammadhossein Askarihemmat Reyhane Askari Hemmat Alexander Hoffman Ivan Lazarevich Ehsan Saboori Olivier Mastropietro Sudhakar Sah Yvon Savaria J. David MQ 37 5 0 24 Jun 2022
Why Quantization Improves Generalization: NTK of Binary Weight Neural Networks Kaiqi Zhang Ming Yin Yu-Xiang Wang MQ 11 4 0 13 Jun 2022