Memory Is All You Need: An Overview of Compute-in-Memory Architectures
for Accelerating Large Language Model Inference

Memory Is All You Need: An Overview of Compute-in-Memory Architectures for Accelerating Large Language Model Inference

12 June 2024

Christopher Wolters

Ulf Schlichtmann

Toyotaro Suzumura

Papers citing "Memory Is All You Need: An Overview of Compute-in-Memory Architectures for Accelerating Large Language Model Inference"

9 / 9 papers shown

Title
PIM-LLM: A High-Throughput Hybrid PIM Architecture for 1-bit LLMs Jinendra Malekar Peyton S. Chandarana Md Hasibul Amin Mohammed E. Elbtity Ramtin Zand 24 1 0 31 Mar 2025
Large Language Model Inference Acceleration: A Comprehensive Hardware Perspective Jinhao Li Jiaming Xu Shan Huang Yonghua Chen Wen Li ... Jiayi Pan Li Ding Hao Zhou Yu Wang Guohao Dai 46 13 0 06 Oct 2024
Analog In-Memory Computing Attention Mechanism for Fast and Energy-Efficient Large Language Models Nathan Leroux Paul-Philipp Manea Chirag Sudarshan Jan Finkbeiner Sebastian Siegel J. Strachan Emre Neftci 11 1 0 28 Sep 2024
Knowledge-Aware Parsimony Learning: A Perspective from Relational Graphs Quanming Yao Yongqi Zhang Yaqing Wang Nan Yin James Kwok Qiang Yang 21 0 0 29 Jun 2024
FlightLLM: Efficient Large Language Model Inference with a Complete Mapping Flow on FPGAs Shulin Zeng Jun Liu Guohao Dai Xinhao Yang Tianyu Fu ... Zehao Wang Ruoyu Zhang Kairui Wen Xuefei Ning Yu Wang 54 53 0 08 Jan 2024
Great Power, Great Responsibility: Recommendations for Reducing Energy for Training Language Models Joseph McDonald Baolin Li Nathan C. Frey Devesh Tiwari V. Gadepally S. Samsi 16 44 0 19 May 2022
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 220 3,054 0 23 Jan 2020
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism M. Shoeybi M. Patwary Raul Puri P. LeGresley Jared Casper Bryan Catanzaro MoE 243 1,791 0 17 Sep 2019
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,927 0 20 Apr 2018