HeteGen: Heterogeneous Parallel Inference for Large Language Models on Resource-Constrained Devices

2 March 2024

Yang You

Papers citing "HeteGen: Heterogeneous Parallel Inference for Large Language Models on Resource-Constrained Devices"

1 / 1 papers shown

Title
STADI: Fine-Grained Step-Patch Diffusion Parallelism for Heterogeneous GPUs Han Liang Jiahui Zhou Zicheng Zhou Xiaoxi Zhang Xu Chen DiffM 155 1 0 05 Sep 2025