QQQ: Quality Quattuor-Bit Quantization for Large Language Models

14 June 2024

Yujie Wang

Papers citing "QQQ: Quality Quattuor-Bit Quantization for Large Language Models"

3 / 3 papers shown

Title
QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving Yujun Lin Haotian Tang Shang Yang Zhekai Zhang Guangxuan Xiao Chuang Gan Song Han 77 71 0 07 May 2024
A Speed Odyssey for Deployable Quantization of LLMs Qingyuan Li Ran Meng Yiduo Li Bo-Wen Zhang Liang Li Yifan Lu Xiangxiang Chu Yerui Sun Yuchen Xie MQ 51 7 0 16 Nov 2023
The Pile: An 800GB Dataset of Diverse Text for Language Modeling Leo Gao Stella Biderman Sid Black Laurence Golding Travis Hoppe ... Horace He Anish Thite Noa Nabeshima Shawn Presser Connor Leahy AIMat 239 1,508 0 31 Dec 2020