Post-Training Quantization for Vision Transformer

27 June 2021

Papers citing "Post-Training Quantization for Vision Transformer"

50 / 192 papers shown

Title
Mix-QSAM: Mixed-Precision Quantization of the Segment Anything Model Navin Ranjan Andreas E. Savakis MQ VLM 61 0 0 08 May 2025
Back to Fundamentals: Low-Level Visual Features Guided Progressive Token Pruning Yuanbing Ouyang Yizhuo Liang Qingpeng Li Xinfei Guo Yiming Luo Di Wu Hao Wang Yushan Pan ViT VLM 64 0 0 25 Apr 2025
Loss Functions in Deep Learning: A Comprehensive Review Omar Elharrouss Yasir Mahmood Yassine Bechqito Mohamed Adel Serhani E. Badidi Jamal Riffi Hamid Tairi 33 0 0 05 Apr 2025
Les Dissonances: Cross-Tool Harvesting and Polluting in Multi-Tool Empowered LLM Agents Zichuan Li Jian Cui Xiaojing Liao Luyi Xing LLMAG 37 0 0 04 Apr 2025
GPTAQ: Efficient Finetuning-Free Quantization for Asymmetric Calibration Yuhang Li Ruokai Yin Donghyun Lee Shiting Xiao Priyadarshini Panda MQ 45 0 0 03 Apr 2025
ViM-VQ: Efficient Post-Training Vector Quantization for Visual Mamba Juncan Deng Shuaiting Li Zeyu Wang Kedong Xu Hong Gu Kejie Huang MQ 60 0 0 12 Mar 2025
Task Vector Quantization for Memory-Efficient Model Merging Youngeun Kim Seunghwan Lee Aecheon Jung Bogon Ryu Sungeun Hong MQ MoMe 52 0 0 10 Mar 2025
SAQ-SAM: Semantically-Aligned Quantization for Segment Anything Model Jing Zhang Z. Li Qingyi Gu MQ VLM 51 0 0 09 Mar 2025
Knowledge-Decoupled Synergetic Learning: An MLLM based Collaborative Approach to Few-shot Multimodal Dialogue Intention Recognition Bin Chen Yu Zhang Hongfei Ye Ziyi Huang Hongyang Chen 56 1 0 06 Mar 2025
AHCPTQ: Accurate and Hardware-Compatible Post-Training Quantization for Segment Anything Model Wenlun Zhang Shimpei Ando Kentaro Yoshioka VLM MQ 57 0 0 05 Mar 2025
RSQ: Learning from Important Tokens Leads to Better Quantized LLMs Yi-Lin Sung Prateek Yadav Jialu Li Jaehong Yoon Mohit Bansal MQ 52 1 0 03 Mar 2025
Split Adaptation for Pre-trained Vision Transformers Lixu Wang Bingqi Shang Y. Li Payal Mohapatra Wei Dong Xiao-Xu Wang Qi Zhu ViT 43 0 0 01 Mar 2025
Hardware-Friendly Static Quantization Method for Video Diffusion Transformers Sanghyun Yi Qingfeng Liu Mostafa El-Khamy MQ VGen 35 0 0 20 Feb 2025
Not Every Patch is Needed: Towards a More Efficient and Effective Backbone for Video-based Person Re-identification Lanyun Zhu T. Chen Deyi Ji Jieping Ye J. Liu 34 2 0 28 Jan 2025
iFormer: Integrating ConvNet and Transformer for Mobile Application Chuanyang Zheng ViT 67 0 0 26 Jan 2025
UAV-Assisted Real-Time Disaster Detection Using Optimized Transformer Model Branislava Jankovic Sabina Jangirova Waseem Ullah Latif U. Khan Mohsen Guizani 29 0 0 21 Jan 2025
Mix-QViT: Mixed-Precision Vision Transformer Quantization Driven by Layer Importance and Quantization Sensitivity Navin Ranjan Andreas E. Savakis MQ 33 1 0 10 Jan 2025
Semantics Prompting Data-Free Quantization for Low-Bit Vision Transformers Yunshan Zhong Yuyao Zhou Yuxin Zhang Shen Li Yong Li Fei Chao Zhanpeng Zeng Rongrong Ji MQ 89 0 0 31 Dec 2024
V"Mean"ba: Visual State Space Models only need 1 hidden dimension Tien-Yu Chi Hung-Yueh Chiang Chi-Chih Chang N. Huang Kai-Chiang Wu 83 0 0 21 Dec 2024
Efficient Quantization-Aware Training on Segment Anything Model in Medical Images and Its Deployment Haisheng Lu Yujie Fu Fan Zhang Le Zhang MedIm MQ 68 0 0 15 Dec 2024
Slicing Vision Transformer for Flexible Inference Yitian Zhang Huseyin Coskun Xu Ma Huan Wang Ke Ma Xi Chen Derek Hao Hu Y. Fu ViT 74 0 0 06 Dec 2024
Behavior Backdoor for Deep Learning Models J. T. Wang Pengfei Zhang R. Tao Jian Yang Hao Liu X. Liu Y. X. Wei Yao Zhao AAML 67 0 0 02 Dec 2024
FuseGPT: Learnable Layers Fusion of Generative Pre-trained Transformers Zehua Pei Hui-Ling Zhen Xianzhi Yu Sinno Jialin Pan M. Yuan Bei Yu AI4CE 84 0 0 21 Nov 2024
Quantization without Tears Minghao Fu Hao Yu Jie Shao Junjie Zhou Ke Zhu Jianxin Wu MQ 61 0 0 21 Nov 2024
MAS-Attention: Memory-Aware Stream Processing for Attention Acceleration on Resource-Constrained Edge Devices Mohammadali Shakerdargah Shan Lu Chao Gao Di Niu 70 0 0 20 Nov 2024
NeuralDEM -- Real-time Simulation of Industrial Particulate Flows Benedikt Alkin Tobias Kronlachner Samuele Papa Stefan Pirker Thomas Lichtenegger Johannes Brandstetter PINN AI4CE 38 1 1 14 Nov 2024
Shrinking the Giant : Quasi-Weightless Transformers for Low Energy Inference Shashank Nag Alan T. L. Bacellar Zachary Susskind Anshul Jha Logan Liberty ... Krishnan Kailas P. Lima Neeraja J. Yadwadkar F. M. G. França L. John 30 0 0 04 Nov 2024
Inference-to-complete: A High-performance and Programmable Data-plane Co-processor for Neural-network-driven Traffic Analysis Dong Wen Z. Liu Tong Yang Tao Li Tianyun Li Chenglong Li Jie Li Zhigang Sun 40 0 0 01 Nov 2024
Q-VLM: Post-training Quantization for Large Vision-Language Models Changyuan Wang Ziwei Wang Xiuwei Xu Yansong Tang Jie Zhou Jiwen Lu MQ 27 1 0 10 Oct 2024
Chip-Tuning: Classify Before Language Models Say Fangwei Zhu Dian Li Jiajun Huang Gang Liu Hui Wang Zhifang Sui 25 0 0 09 Oct 2024
On Efficient Variants of Segment Anything Model: A Survey Xiaorui Sun J. Liu H. Shen Xiaofeng Zhu Ping Hu VLM 43 4 0 07 Oct 2024
Error Correction Code Transformer: From Non-Unified to Unified Yongli Yan Jieao Zhu Tianyue Zheng Jiaqi He Linglong Dai 16 1 0 04 Oct 2024
Spiking Transformer with Spatial-Temporal Attention Donghyun Lee Yuhang Li Youngeun Kim Shiting Xiao Priyadarshini Panda 16 1 0 29 Sep 2024
PTQ4RIS: Post-Training Quantization for Referring Image Segmentation Xiaoyan Jiang Hang Yang Kaiying Zhu Xihe Qiu Shibo Zhao Sifan Zhou MQ 16 0 0 25 Sep 2024
Art and Science of Quantizing Large-Scale Models: A Comprehensive Overview Yanshu Wang Tong Yang Xiyan Liang Guoan Wang Hanning Lu Xu Zhe Yaoming Li Li Weitao MQ 34 2 0 18 Sep 2024
Infrared Domain Adaptation with Zero-Shot Quantization Burak Sevsay Erdem Akagündüz VLM MQ 18 0 0 25 Aug 2024
Computer Vision Model Compression Techniques for Embedded Systems: A Survey Alexandre Lopes Fernando Pereira dos Santos D. Oliveira Mauricio Schiezaro Hélio Pedrini 26 5 0 15 Aug 2024
Token Compensator: Altering Inference Cost of Vision Transformer without Re-Tuning Shibo Jie Yehui Tang Jianyuan Guo Zhi-Hong Deng Kai Han Yunhe Wang VLM 23 2 0 13 Aug 2024
DopQ-ViT: Towards Distribution-Friendly and Outlier-Aware Post-Training Quantization for Vision Transformers Lianwei Yang Haisong Gong Qingyi Gu MQ 32 2 0 06 Aug 2024
MimiQ: Low-Bit Data-Free Quantization of Vision Transformers with Encouraging Inter-Head Attention Similarity Kanghyun Choi Hyeyoon Lee Dain Kwon Sunjong Park Kyuyeun Kim Noseong Park Jinho Lee Jinho Lee MQ 40 1 0 29 Jul 2024
Mixed Non-linear Quantization for Vision Transformers Gihwan Kim Jemin Lee Sihyeong Park Yongin Kwon Hyungshin Kim MQ 30 0 0 26 Jul 2024
CHOSEN: Compilation to Hardware Optimization Stack for Efficient Vision Transformer Inference Mohammad Erfan Sadeghi A. Fayyazi Suhas Somashekar Massoud Pedram 32 2 0 17 Jul 2024
Quantized Prompt for Efficient Generalization of Vision-Language Models Tianxiang Hao Xiaohan Ding Juexiao Feng Yuhong Yang Hui Chen Guiguang Ding VLM MQ 22 5 0 15 Jul 2024
Neural-based Video Compression on Solar Dynamics Observatory Images Atefeh Khoshkhahtinat Ali Zafari P. Mehta Nasser M. Nasrabadi Barbara J. Thompson M. Kirk D. D. Silva 39 0 0 12 Jul 2024
Scaling Up Personalized Aesthetic Assessment via Task Vector Customization Jooyeol Yun Jaegul Choo MoMe 20 2 0 09 Jul 2024
CLAMP-ViT: Contrastive Data-Free Learning for Adaptive Post-Training Quantization of ViTs Akshat Ramachandran Souvik Kundu Tushar Krishna MQ 27 7 0 07 Jul 2024
PRANCE: Joint Token-Optimization and Structural Channel-Pruning for Adaptive ViT Inference Ye Li Chen Tang Yuan Meng Jiajun Fan Zenghao Chai Xinzhu Ma Zhi Wang Wenwu Zhu 29 1 0 06 Jul 2024
The Impact of Quantization and Pruning on Deep Reinforcement Learning Models Heng Lu Mehdi Alemi Reza Rawassizadeh 26 1 0 05 Jul 2024
ISQuant: apply squant to the real deployment Dezan Zhao MQ 19 0 0 05 Jul 2024
Timestep-Aware Correction for Quantized Diffusion Models Yuzhe Yao Feng Tian Jun Chen Haonan Lin Guang Dai Yong Liu Jingdong Wang DiffM MQ 33 4 0 04 Jul 2024