v1v2 (latest)

QDrop: Randomly Dropping Quantization for Extremely Low-bit Post-Training Quantization

International Conference on Learning Representations (ICLR), 2022

11 March 2022

Xiuying Wei

Yazhe Niu

Yuhang Li

Xianglong Liu

F. Yu

VLM

ArXiv (abs)PDF HTML Github (122★)

Papers citing "QDrop: Randomly Dropping Quantization for Extremely Low-bit Post-Training Quantization"

50 / 124 papers shown

Advancing Multimodal Large Language Models with Quantization-Aware Scale Learning for Efficient AdaptationACM Multimedia (MM), 2024

Rongrong Ji

177

07 Aug 2024

DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers

479

06 Aug 2024

Temporal Feature Matters: A Framework for Diffusion Model QuantizationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

652

28 Jul 2024

Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners

369

22 Jul 2024

MetaAug: Meta-Data Augmentation for Post-Training Quantization

Trung Le

237

20 Jul 2024

AdaLog: Post-Training Quantization for Vision Transformers with Adaptive Logarithm Quantizer

340

17 Jul 2024

QVD: Post-training Quantization for Video Diffusion Models

Jinyang Guo

Xianglong Liu

Shengxi Li

Hao Yang

Tao Xie

VGen MQ

280

16 Jul 2024

NITRO-D: Native Integer-only Training of Deep Convolutional Neural Networks

Alberto Pirillo

Luca Colombo

Manuel Roveri

413

16 Jul 2024

LRQ: Optimizing Post-Training Quantization for Large Language Models by Learning Low-Rank Weight-Scaling Matrices

345

16 Jul 2024

ISQuant: apply squant to the real deployment

Dezan Zhao

193

05 Jul 2024

ADFQ-ViT: Activation-Distribution-Friendly Post-Training Quantization for Vision Transformers

Tao Li

303

03 Jul 2024

Compensate Quantization Errors: Make Weights Hierarchical to Compensate Each Other

Jun Cheng

196

24 Jun 2024

MGRQ: Post-Training Quantization For Vision Transformer With Mixed Granularity Reconstruction

193

13 Jun 2024

Asymptotic Unbiased Sample Sampling to Speed Up Sharpness-Aware Minimization

Jiaxin Deng

Junbiao Pang

Baochang Zhang

473

12 Jun 2024

MagR: Weight Magnitude Reduction for Enhancing Post-Training Quantization

227

02 Jun 2024

LCQ: Low-Rank Codebook based Quantization for Large Language Models

Wen-Pu Cai

Wu-Jun Li

338

31 May 2024

Information Entropy Guided Height-aware Histogram for Quantization-friendly Pillar Feature Encoder

617

29 May 2024

I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models

409

28 May 2024

PTQ4DiT: Post-training Quantization for Diffusion Transformers

Junyi Wu

Haoxuan Wang

Yuzhang Shang

Mubarak Shah

Yan Yan

306

25 May 2024

Nearest is Not Dearest: Towards Practical Defense against Quantization-conditioned Backdoor Attacks

260

21 May 2024

Selective Focus: Investigating Semantics Sensitivity in Post-training Quantization for Lane DetectionAAAI Conference on Artificial Intelligence (AAAI), 2024

218

10 May 2024

Fast and Controllable Post-training Sparsity: Learning Optimal Sparsity Allocation with Global Constraint in MinutesAAAI Conference on Artificial Intelligence (AAAI), 2024

Jinyang Guo

194

09 May 2024

LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression ToolkitConference on Empirical Methods in Natural Language Processing (EMNLP), 2024

342

09 May 2024

PTQ4SAM: Post-Training Quantization for Segment AnythingComputer Vision and Pattern Recognition (CVPR), 2024

Jinyang Guo

Xianglong Liu

198

06 May 2024

Torch2Chip: An End-to-end Customizable Deep Neural Network Compression and Deployment Toolkit for Prototype Hardware Accelerator DesignConference on Machine Learning and Systems (MLSys), 2024

Jian Meng

Yuan Liao

Anupreetham Anupreetham

Jae-sun Seo

211

02 May 2024

Frame Quantization of Neural Networks

Wojciech Czaja

Sanghoon Na

210

11 Apr 2024

Instance-Aware Group Quantization for Vision Transformers

251

01 Apr 2024

AffineQuant: Affine Transformation Quantization for Large Language Models

Rui Wang

251

19 Mar 2024

COMQ: A Backpropagation-Free Algorithm for Post-Training QuantizationIEEE Access (IEEE Access), 2024

206

11 Mar 2024

Towards Accurate Post-training Quantization for Reparameterized Models

193

25 Feb 2024

Effective Gradient Sample Size via Variation Estimation for Accelerating Sharpness aware Minimization

209

24 Feb 2024

QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning

394

06 Feb 2024

LiDAR-PTQ: Post-Training Quantization for Point Cloud 3D Object DetectionInternational Conference on Learning Representations (ICLR), 2024

206

29 Jan 2024

GenQ: Quantization in Low Data Regimes with Generative Synthetic DataEuropean Conference on Computer Vision (ECCV), 2023

Yuhang Li

Youngeun Kim

Donghyun Lee

Souvik Kundu

Priyadarshini Panda

334

07 Dec 2023

TFMQ-DM: Temporal Feature Maintenance Quantization for Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Jing Liu

279

27 Nov 2023

I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization

408

16 Nov 2023

Quantized Distillation: Optimizing Driver Activity Recognition Models for Resource-Constrained EnvironmentsIEEE/RJS International Conference on Intelligent RObots and Systems (IROS), 2023

198

10 Nov 2023

LLM-FP4: 4-Bit Floating-Point Quantized TransformersConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

239

25 Oct 2023

TEQ: Trainable Equivalent Transformation for Quantization of LLMs

281

17 Oct 2023

QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language ModelsInternational Conference on Learning Representations (ICLR), 2023

Jing Liu

Yazhe Niu

Xiuying Wei

Zhiwei Dong

Jianfei Cai

Bohan Zhuang

299

12 Oct 2023

Dual Grained Quantization: Efficient Fine-Grained Quantization for LLM

212

07 Oct 2023

EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

Bohan Zhuang

522

05 Oct 2023

Network Memory Footprint Compression Through Jointly Learnable Codebooks and MappingsInternational Conference on Learning Representations (ICLR), 2023

Vittorio Giammarino

Arnaud Dapogny

Kévin Bailly

187

29 Sep 2023

EPTQ: Enhanced Post-Training Quantization via Label-Free Hessian

Ofir Gordon

H. Habi

Arnon Netzer

235

20 Sep 2023

Optimize Weight Rounding via Signed Gradient Descent for the Quantization of LLMsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

507

11 Sep 2023

Gradient-Based Post-Training Quantization: Challenging the Status Quo

Edouard Yvinec

Arnaud Dapogny

Kévin Bailly

223

15 Aug 2023

EQ-Net: Elastic Quantization Neural NetworksIEEE International Conference on Computer Vision (ICCV), 2023

348

15 Aug 2023

NUPES : Non-Uniform Post-Training Quantization via Power Exponent SearchIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Edouard Yvinec

Arnaud Dapogny

Kévin Bailly

174

10 Aug 2023

Lossy and Lossless (L

^2

) Post-training Model Size CompressionIEEE International Conference on Computer Vision (ICCV), 2023

189

08 Aug 2023

Squeezing Large-Scale Diffusion Models for Mobile

206

03 Jul 2023