v1v2v3 (latest)

Sequence Parallelism: Long Sequence Training from System Perspective

Annual Meeting of the Association for Computational Linguistics (ACL), 2021

26 May 2021

Yang You

ArXiv (abs)PDF HTML HuggingFace (6 upvotes)

Papers citing "Sequence Parallelism: Long Sequence Training from System Perspective"

24 / 74 papers shown

Galaxy: A Resource-Efficient Collaborative Edge AI System for In-situ Transformer Inference

Xu Chen

198

27 May 2024

360Zhinao Technical Report

360Zhinao Team

221

22 May 2024

The CAP Principle for LLM Serving: A Survey of Long-Context Large Language Model Serving

Pai Zeng

Zhenyu Ning

Jieru Zhao

Mengwei Xu

292

18 May 2024

KV-Runahead: Scalable Causal LLM Inference by Parallel Key-Value Cache GenerationInternational Conference on Machine Learning (ICML), 2024

Minsik Cho

Mohammad Rastegari

Devang Naik

217

08 May 2024

Towards Green AI: Current status and future research

258

01 May 2024

LoongServe: Efficiently Serving Long-context Large Language Models with Elastic Sequence Parallelism

Xin Jin

366

113

15 Apr 2024

BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences

Sun Ao

Weilin Zhao

Xu Han

Cheng Yang

Zhiyuan Liu

Chuan Shi

Maosong Sun

GNN

274

14 Mar 2024

Yi: Open Foundation Models by 01.AI

...

840

768

07 Mar 2024

Data Engineering for Scaling Language Models to 128K Context

358

183

15 Feb 2024

InternEvo: Efficient Long-sequence Large Language Model Training via Hybrid Parallelism and Redundant Sharding

...

Xin Jin

306

17 Jan 2024

Infinite-LLM: Efficient LLM Service for Long Context with DistAttention and Distributed KVCache

...

Yong Li

304

05 Jan 2024

Unicron: Economizing Self-Healing LLM Training at Scale

Jingren Zhou

216

30 Dec 2023

Towards Message Brokers for Generative AI: Survey, Challenges, and Opportunities

340

22 Dec 2023

Gated Linear Attention Transformers with Hardware-Efficient Training

Bailin Wang

477

303

11 Dec 2023

Tenplex: Dynamic Parallelism for Deep Learning using Parallelizable Tensor CollectionsSymposium on Operating Systems Principles (SOSP), 2023

350

08 Dec 2023

The Efficiency Spectrum of Large Language Models: An Algorithmic Survey

Tianyi Chen

397

01 Dec 2023

Advancing Transformer Architecture in Long-Context Large Language Models: A Comprehensive Survey

...

373

101

21 Nov 2023

Just-in-time Quantization with Processing-In-Memory for Efficient ML Training

M. Ibrahim

Shaizeen Aga

Ada Li

Suchita Pati

Mahzabeen Islam

275

08 Nov 2023

Ultra-Long Sequence Distributed Transformer

Mayanka Chandra Shekar

336

04 Nov 2023

Scaling Laws of RoPE-based ExtrapolationInternational Conference on Learning Representations (ICLR), 2023

Xiaoran Liu

Hang Yan

Shuo Zhang

Chen An

Xipeng Qiu

Dahua Lin

265

117

08 Oct 2023

Ring Attention with Blockwise Transformers for Near-Infinite ContextInternational Conference on Learning Representations (ICLR), 2023

Hao Liu

Matei A. Zaharia

Pieter Abbeel

657

393

03 Oct 2023

DeepSpeed Ulysses: System Optimizations for Enabling Training of Extreme Long Sequence Transformer Models

Yuxiong He

378

180

25 Sep 2023

Reducing Activation Recomputation in Large Transformer ModelsConference on Machine Learning and Systems (MLSys), 2022

300

388

10 May 2022

Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel TrainingInternational Conference on Parallel Processing (ICPP), 2021

Yang You

282

190

28 Oct 2021