v1v2 (latest)

Post-Training Piecewise Linear Quantization for Deep Neural Networks

European Conference on Computer Vision (ECCV), 2020

31 January 2020

Papers citing "Post-Training Piecewise Linear Quantization for Deep Neural Networks"

50 / 73 papers shown

MDM: Manhattan Distance Mapping of DNN Weights for Parasitic-Resistance-Resilient Memristive CrossbarsInternational Conference on Learning Representations (ICLR), 2025

Matheus Farias

Wanghley Martins

H. T. Kung

147

06 Nov 2025

Outlier-Aware Post-Training Quantization for Image Super-Resolution

226

01 Nov 2025

AccuQuant: Simulating Multiple Denoising Steps for Quantizing Diffusion Models

283

23 Oct 2025

Collaborative Compression for Large-Scale MoE Deployment on Edge

115

30 Sep 2025

Bi-VLM: Pushing Ultra-Low Precision Post-Training Quantization Boundaries in Vision-Language Models

257

23 Sep 2025

Enhancing Quantization-Aware Training on Edge Devices via Relative Entropy Coreset Selection and Cascaded Layer Correction

Yujia Tong

Jingling Yuan

Chuang Hu

241

17 Jul 2025

Robust Machine Unlearning for Quantized Neural Networks via Adaptive Gradient Reweighting with Similar Labels

334

18 Mar 2025

Task Vector Quantization for Memory-Efficient Model Merging

357

10 Mar 2025

On the Impact of White-box Deployment Strategies for Edge AI on Latency and Model Performance

481

01 Nov 2024

Efficient Reprogramming of Memristive Crossbars for DNNs: Weight Sorting and Bit StuckingInternational Symposium on Circuits and Systems (ISCAS), 2024

Matheus Farias

H. T. Kung

206

29 Oct 2024

Sorted Weight Sectioning for Energy-Efficient Unstructured Sparse DNNs on Compute-in-Memory CrossbarsInternational Symposium on Circuits and Systems (ISCAS), 2024

Matheus Farias

H. T. Kung

304

15 Oct 2024

Post-Training Quantization in Brain-Computer Interfaces based on Event-Related Potential DetectionIEEE International Conference on Systems, Man and Cybernetics (SMC), 2024

106

10 Oct 2024

Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview

Li Weitao

448

18 Sep 2024

Quantizing YOLOv7: A Comprehensive Study

Mohammadamin Baghbanbashi

Mohsen Raji

B. Ghavami

215

06 Jul 2024

Robust Knowledge Distillation Based on Feature Variance Against Backdoored Teacher Model

200

01 Jun 2024

EdgeSight: Enabling Modeless and Cost-Efficient Inference at the Edge

ChonLam Lao

Jiaqi Gao

Ganesh Ananthanarayanan

Aditya Akella

Minlan Yu

VLM

265

29 May 2024

Predicting High-precision Depth on Low-Precision Devices Using 2D Hilbert Curves

261

22 May 2024

Investigating the Impact of Quantization on Adversarial Robustness

Chen Tang

206

08 Apr 2024

DNN Memory Footprint Reduction via Post-Training Intra-Layer Multi-Precision QuantizationIEEE International Symposium on Quality Electronic Design (ISQED), 2024

225

03 Apr 2024

Instance-Aware Group Quantization for Vision Transformers

301

01 Apr 2024

On the Impact of Black-box Deployment Strategies for Edge AI on Latency and Model Performance

486

25 Mar 2024

Achieving Pareto Optimality using Efficient Parameter Reduction for DNNs in Resource-Constrained Edge Environment

343

14 Mar 2024

QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning

313

11 Mar 2024

Tiny Reinforcement Learning for Quadruped Locomotion using Decision Transformers

269

20 Feb 2024

BiLLM: Pushing the Limit of Post-Training Quantization for LLMsInternational Conference on Machine Learning (ICML), 2024

Xianglong Liu

Michele Magno

Xiaojuan Qi

406

154

06 Feb 2024

LLM-Powered Hierarchical Language Agent for Real-time Human-AI Coordination

Chao Yu

429

23 Dec 2023

IDKM: Memory Efficient Neural Network Quantization via Implicit, Differentiable k-Means

Sean Jaffe

Ambuj K. Singh

Francesco Bullo

296

12 Dec 2023

GenQ: Quantization in Low Data Regimes with Generative Synthetic DataEuropean Conference on Computer Vision (ECCV), 2023

Yuhang Li

Youngeun Kim

Donghyun Lee

Souvik Kundu

Priyadarshini Panda

385

07 Dec 2023

Efficient Neural Networks for Tiny Machine Learning: A Comprehensive Review

M. Lê

Pierre Wolinski

Julyan Arbel

348

20 Nov 2023

Exploring Post-Training Quantization of Protein Language ModelsIEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2023

181

30 Oct 2023

SINF: Semantic Neural Network Inference with Semantic Subgraphs

Sazzad Sayyed

Jonathan D. Ashdown

302

02 Oct 2023

A Survey on Model Compression for Large Language ModelsTransactions of the Association for Computational Linguistics (TACL), 2023

Jian Li

465

417

15 Aug 2023

Digital Modeling on Large Kernel Metamaterial Neural NetworkJournal of Imaging Science and Technology (JIST), 2023

Yuankai Huo

244

21 Jul 2023

Q-YOLO: Efficient Inference for Real-time Object DetectionAsian Conference on Pattern Recognition (ACPR), 2023

Xuhui Liu

222

01 Jul 2023

Efficient Online Processing with Deep Neural Networks

Lukas Hedegaard

255

23 Jun 2023

Towards Accurate Post-training Quantization for Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Jie Zhou

395

30 May 2023

MBQuant: A Novel Multi-Branch Topology Method for Arbitrary Bit-width Network QuantizationPattern Recognition (Pattern Recogn.), 2023

Mingliang Xu

Yuyao Zhou

Jiayi Ji

Rongrong Ji

274

14 May 2023

GSB: Group Superposition Binarization for Vision Transformer with Limited Training SamplesNeural Networks (Neural Netw.), 2023

476

13 May 2023

CrAFT: Compression-Aware Fine-Tuning for Efficient Visual Task Adaptation

297

08 May 2023

Q-DETR: An Efficient Low-Bit Quantized Detection TransformerComputer Vision and Pattern Recognition (CVPR), 2023

Sheng Xu

271

01 Apr 2023

Towards Accurate Post-Training Quantization for Vision TransformerACM Multimedia (ACM MM), 2022

Xianglong Liu

392

106

25 Mar 2023

Ultra-low Precision Multiplication-free Training for Deep Neural Networks

Yifan Hao

Ling Li

361

28 Feb 2023

Data Quality-aware Mixed-precision Quantization via Hybrid Reinforcement LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2023

291

09 Feb 2023

PowerQuant: Automorphism Search for Non-Uniform QuantizationInternational Conference on Learning Representations (ICLR), 2023

266

24 Jan 2023

PD-Quant: Post-Training Quantization based on Prediction Difference MetricComputer Vision and Pattern Recognition (CVPR), 2022

612

102

14 Dec 2022

Vertical Layering of Quantized Neural Networks for Heterogeneous InferenceIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Xiaojuan Qi

319

10 Dec 2022

Q-ViT: Accurate and Fully Quantized Low-bit Vision TransformerNeural Information Processing Systems (NeurIPS), 2022

Sheng Xu

251

146

13 Oct 2022

Bitwidth-Adaptive Quantization-Aware Neural Network Training: A Meta-Learning ApproachEuropean Conference on Computer Vision (ECCV), 2022

241

20 Jul 2022

A Comprehensive Survey on Model Quantization for Deep Neural Networks in Image ClassificationACM Transactions on Intelligent Systems and Technology (ACM TIST), 2022

Babak Rokh

A. Azarpeyvand

Alireza Khanteymoori

535

211

14 May 2022

SPIQ: Data-Free Per-Channel Static Input QuantizationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

178

28 Mar 2022