v1v2v3 (latest)

Deep Learning Workload Scheduling in GPU Datacenters: Taxonomy, Challenges and Vision

24 May 2022

Xiaolin Wang

Yingwei Luo

Tianwei Zhang

Yonggang Wen

ArXiv (abs)PDF HTML Github (292★)

Papers citing "Deep Learning Workload Scheduling in GPU Datacenters: Taxonomy, Challenges and Vision"

6 / 6 papers shown

CARMA: Collocation-Aware Resource Manager

Ehsan Yousefzadeh-Asl-Miandoab

Reza Karimzadeh

Bulat Ibragimov

145

26 Aug 2025

Accurate GPU Memory Prediction for Deep Learning Jobs through Dynamic Analysis

Jiabo Shi

Yehia Elkhatib

3DH VLM

280

04 Apr 2025

FlexLLM: Token-Level Co-Serving of LLM Inference and Finetuning with SLO Guarantees

...

643

29 Feb 2024

Pollen: High-throughput Federated Learning Simulation via Resource-Aware Client Placement

Javier Fernandez-Marques

Nicholas D. Lane

273

30 Jun 2023

Sustainable AIGC Workload Scheduling of Geo-Distributed Data Centers: A Multi-Agent Reinforcement Learning ApproachGlobal Communications Conference (GLOBECOM), 2023

Siyue Zhang

Minrui Xu

Wei Yang Bryan Lim

Dusit Niyato

118

17 Apr 2023

Task Placement and Resource Allocation for Edge Machine Learning: A GNN-based Multi-Agent Reinforcement Learning ParadigmIEEE Transactions on Parallel and Distributed Systems (TPDS), 2023

Xu Chen

362

01 Feb 2023