Search What You Want: Barrier Panelty NAS for Mixed Precision Quantization

20 July 2020

Papers citing "Search What You Want: Barrier Panelty NAS for Mixed Precision Quantization"

27 / 27 papers shown

Title
Learning from Loss Landscape: Generalizable Mixed-Precision Quantization via Adaptive Sharpness-Aware Gradient Aligning Lianbo Ma Jianlun Ma Yuee Zhou Guoyang Xie Qiang He Zhichao Lu MQ 45 0 0 08 May 2025
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks Beatrice Alessandra Motetti Matteo Risso Alessio Burrello Enrico Macii M. Poncino Daniele Jahier Pagliari MQ 44 2 0 01 Jul 2024
TMPQ-DM: Joint Timestep Reduction and Quantization Precision Selection for Efficient Diffusion Models Haojun Sun Chen Tang Zhi Wang Yuan Meng Jingyan Jiang Xinzhu Ma Wenwu Zhu MQ 31 5 0 15 Apr 2024
Differentiable Search for Finding Optimal Quantization Strategy Lianqiang Li Chenqian Yan Yefei Chen MQ 21 2 0 10 Apr 2024
Retraining-free Model Quantization via One-Shot Weight-Coupling Learning Chen Tang Yuan Meng Jiacheng Jiang Shuzhao Xie Rongwei Lu Xinzhu Ma Zhi Wang Wenwu Zhu MQ 22 8 0 03 Jan 2024
MetaMix: Meta-state Precision Searcher for Mixed-precision Activation Quantization Han-Byul Kim Joo Hyung Lee Sungjoo Yoo Hong-Seok Kim MQ 21 3 0 12 Nov 2023
Post-training Quantization for Text-to-Image Diffusion Models with Progressive Calibration and Activation Relaxing Siao Tang Xin Wang Hong Chen Chaoyu Guan Zewen Wu Yansong Tang Wenwu Zhu MQ 35 16 0 10 Nov 2023
Flow-Based Feature Fusion for Vehicle-Infrastructure Cooperative 3D Object Detection Haibao Yu Yingjuan Tang Enze Xie Jilei Mao Ping Luo Zaiqing Nie 3DPC 36 26 0 03 Nov 2023
EMQ: Evolving Training-free Proxies for Automated Mixed Precision Quantization Peijie Dong Lujun Li Zimian Wei Xin-Yi Niu Zhiliang Tian H. Pan MQ 40 28 0 20 Jul 2023
Learning Accurate Performance Predictors for Ultrafast Automated Model Compression Ziwei Wang Jiwen Lu Han Xiao Shengyu Liu Jie Zhou OffRL 21 1 0 13 Apr 2023
SEAM: Searching Transferable Mixed-Precision Quantization Policy through Large Margin Regularization Chen Tang Kai Ouyang Zenghao Chai Yunpeng Bai Yuan Meng Zhi Wang Wenwu Zhu MQ 32 9 0 14 Feb 2023
Efficient and Effective Methods for Mixed Precision Neural Network Quantization for Faster, Energy-efficient Inference Deepika Bablani J. McKinstry S. K. Esser R. Appuswamy D. Modha MQ 20 4 0 30 Jan 2023
CSMPQ:Class Separability Based Mixed-Precision Quantization Ming-Yu Wang Taisong Jin Miaohui Zhang Zhengtao Yu MQ 23 0 0 20 Dec 2022
Enhanced Training of Query-Based Object Detection via Selective Query Recollection Fangyi Chen Han Zhang Kaiqin Hu Yu-Kai Huang Chenchen Zhu Marios Savvides ObjD 31 38 0 15 Dec 2022
Design Automation for Fast, Lightweight, and Effective Deep Learning Models: A Survey Dalin Zhang Kaixuan Chen Yan Zhao B. Yang Li-Ping Yao Christian S. Jensen 43 3 0 22 Aug 2022
Mixed-Precision Neural Networks: A Survey M. Rakka M. Fouda Pramod P. Khargonekar Fadi J. Kurdahi MQ 18 11 0 11 Aug 2022
Mixed-Precision Inference Quantization: Radically Towards Faster inference speed, Lower Storage requirement, and Lower Loss Daning Cheng Wenguang Chen MQ 21 0 0 20 Jul 2022
SDQ: Stochastic Differentiable Quantization with Mixed Precision Xijie Huang Zhiqiang Shen Shichao Li Zechun Liu Xianghong Hu Jeffry Wicaksana Eric P. Xing Kwang-Ting Cheng MQ 16 33 0 09 Jun 2022
Quantization in Layer's Input is Matter Daning Cheng Wenguang Chen MQ 11 0 0 10 Feb 2022
UDC: Unified DNAS for Compressible TinyML Models Igor Fedorov Ramon Matas Hokchhay Tann Chu Zhou Matthew Mattina P. Whatmough AI4CE 21 13 0 15 Jan 2022
Learning Robust and Lightweight Model through Separable Structured Transformations Xian Wei Yanhui Huang Yang Xu Mingsong Chen Hai Lan Yuanxiang Li Zhongfeng Wang Xuan Tang OOD 24 0 0 27 Dec 2021
Generalizable Mixed-Precision Quantization via Attribution Rank Preservation Ziwei Wang Han Xiao Jiwen Lu Jie Zhou MQ 14 32 0 05 Aug 2021
Improved Techniques for Quantizing Deep Networks with Adaptive Bit-Widths Ximeng Sun Rameswar Panda Chun-Fu Chen Naigang Wang Bowen Pan Bowen Pan Kailash Gopalakrishnan A. Oliva Rogerio Feris Kate Saenko MQ 19 4 0 02 Mar 2021
A Comprehensive Survey on Hardware-Aware Neural Architecture Search Hadjer Benmeziane K. E. Maghraoui Hamza Ouarnoughi Smail Niar Martin Wistuba Naigang Wang 26 95 0 22 Jan 2021
BiPointNet: Binary Neural Network for Point Clouds Haotong Qin Zhongang Cai Mingyuan Zhang Yifu Ding Haiyu Zhao Shuai Yi Xianglong Liu Hao Su 3DPC 22 50 0 12 Oct 2020
Weight-Sharing Neural Architecture Search: A Battle to Shrink the Optimization Gap Lingxi Xie Xin Chen Kaifeng Bi Longhui Wei Yuhui Xu ... Lanfei Wang Anxiang Xiao Jianlong Chang Xiaopeng Zhang Qi Tian ViT 33 108 0 04 Aug 2020
Incremental Network Quantization: Towards Lossless CNNs with Low-Precision Weights Aojun Zhou Anbang Yao Yiwen Guo Lin Xu Yurong Chen MQ 313 1,047 0 10 Feb 2017