GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference

GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference

23 December 2024

Papers citing "GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference"

Title
No papers