Cheaply Evaluating Inference Efficiency Metrics for Autoregressive
Transformer APIs

Cheaply Evaluating Inference Efficiency Metrics for Autoregressive Transformer APIs

3 May 2023

Deepak Narayanan

Keshav Santhanam

Peter Henderson

Rishi Bommasani

Papers citing "Cheaply Evaluating Inference Efficiency Metrics for Autoregressive Transformer APIs"

6 / 6 papers shown

Title
ELLEN: Extremely Lightly Supervised Learning For Efficient Named Entity Recognition Haris Riaz Razvan-Gabriel Dumitru Mihai Surdeanu MU 27 0 0 26 Mar 2024
What Language Model to Train if You Have One Million GPU Hours? Teven Le Scao Thomas Wang Daniel Hesslow Lucile Saulnier Stas Bekman ... Lintang Sutawika Jaesung Tae Zheng-Xin Yong Julien Launay Iz Beltagy MoE AI4CE 212 103 0 27 Oct 2022
RAFT: A Real-World Few-Shot Text Classification Benchmark Neel Alex Eli Lifland Lewis Tunstall A. Thakur Pegah Maham ... Carolyn Ashurst Paul Sedille A. Carlier M. Noetel Andreas Stuhlmuller RALM 163 56 0 28 Sep 2021
Carbon Emissions and Large Neural Network Training David A. Patterson Joseph E. Gonzalez Quoc V. Le Chen Liang Lluís-Miquel Munguía D. Rothchild David R. So Maud Texier J. Dean AI4CE 233 626 0 21 Apr 2021
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 220 3,054 0 23 Jan 2020
Megatron-LM: Training Multi-Billion Parameter Language Models Using Model Parallelism M. Shoeybi M. Patwary Raul Puri P. LeGresley Jared Casper Bryan Catanzaro MoE 243 1,791 0 17 Sep 2019