DKM: Differentiable K-Means Clustering Layer for Neural Network
Compression

DKM: Differentiable K-Means Clustering Layer for Neural Network Compression

28 August 2021

Minsik Cho

Keivan Alizadeh Vahid

Saurabh N. Adya

Mohammad Rastegari

Papers citing "DKM: Differentiable K-Means Clustering Layer for Neural Network Compression"

12 / 12 papers shown

Title
MAS-Attention: Memory-Aware Stream Processing for Attention Acceleration on Resource-Constrained Edge Devices Mohammadali Shakerdargah Shan Lu Chao Gao Di Niu 70 0 0 20 Nov 2024
PixOOD: Pixel-Level Out-of-Distribution Detection Tomávs Vojívr Jan Sochman Jivrí Matas OODD 43 9 0 30 May 2024
EncodingNet: A Novel Encoding-based MAC Design for Efficient Neural Network Acceleration Bo Liu Grace Li Zhang Xunzhao Yin Ulf Schlichtmann Bing Li MQ AI4CE 30 0 0 25 Feb 2024
GPTVQ: The Blessing of Dimensionality for LLM Quantization M. V. Baalen Andrey Kuzmin Markus Nagel Peter Couperus Cédric Bastoul E. Mahurin Tijmen Blankevoort Paul N. Whatmough MQ 34 28 0 23 Feb 2024
Polytopic Autoencoders with Smooth Clustering for Reduced-order Modelling of Flows Jan Heiland Yongho Kim AI4CE 24 2 0 19 Jan 2024
eDKM: An Efficient and Accurate Train-time Weight Clustering for Large Language Models Minsik Cho Keivan Alizadeh Vahid Qichen Fu Saurabh N. Adya C. C. D. Mundo Mohammad Rastegari Devang Naik Peter Zatloukal MQ 21 6 0 02 Sep 2023
Hyperspherical Quantization: Toward Smaller and More Accurate Models Dan Liu X. Chen Chen-li Ma Xue Liu MQ 27 3 0 24 Dec 2022
Deep learning model compression using network sensitivity and gradients M. Sakthi N. Yadla Raj Pawate 19 2 0 11 Oct 2022
Recycling Model Updates in Federated Learning: Are Gradient Subspaces Low-Rank? Sheikh Shams Azam Seyyedali Hosseinalipour Qiang Qiu Christopher G. Brinton FedML 20 20 0 01 Feb 2022
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 297 6,959 0 20 Apr 2018
Universal Deep Neural Network Compression Yoojin Choi Mostafa El-Khamy Jungwon Lee MQ 81 85 0 07 Feb 2018
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Andrew G. Howard Menglong Zhu Bo Chen Dmitry Kalenichenko Weijun Wang Tobias Weyand M. Andreetto Hartwig Adam 3DH 950 20,567 0 17 Apr 2017