v1v2v3v4 (latest)

OPT: Open Pre-trained Transformer Language Models

2 May 2022

Xian Li

Luke Zettlemoyer

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "OPT: Open Pre-trained Transformer Language Models"

24 / 2,924 papers shown

Language Models with Image Descriptors are Strong Few-Shot Video-Language LearnersNeural Information Processing Systems (NeurIPS), 2022

...

Heng Ji

542

163

22 May 2022

A Study on Transformer Configuration and Training ObjectiveInternational Conference on Machine Learning (ICML), 2022

Xin Jiang

Yang You

208

21 May 2022

Visually-Augmented Language ModelingInternational Conference on Learning Representations (ICLR), 2022

Xiaodong Liu

232

20 May 2022

Clinical Prompt Learning with Frozen Language Models

141

11 May 2022

The Unreliability of Explanations in Few-shot Prompting for Textual ReasoningNeural Information Processing Systems (NeurIPS), 2022

Xi Ye

Greg Durrett

ReLM LRM

319

229

06 May 2022

MiCS: Near-linear Scaling for Training Gigantic Model on Public CloudProceedings of the VLDB Endowment (PVLDB), 2022

George Karypis

Xin Jin

477

30 Apr 2022

mGPT: Few-Shot Learners Go MultilingualTransactions of the Association for Computational Linguistics (TACL), 2022

Alena Fenogenova

364

192

15 Apr 2022

REx: Data-Free Residual Quantization Error ExpansionNeural Information Processing Systems (NeurIPS), 2022

345

28 Mar 2022

In-Context Learning for Few-Shot Dialogue State TrackingConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Tao Yu

Mari Ostendorf

343

16 Mar 2022

GrIPS: Gradient-free, Edit-based Instruction Search for Prompting Large Language ModelsConference of the European Chapter of the Association for Computational Linguistics (EACL), 2022

Archiki Prasad

Peter Hase

Xiang Zhou

Joey Tianyi Zhou

249

148

14 Mar 2022

Internet-augmented language models through few-shot prompting for open-domain question answering

Wojciech Stokowiec

244

159

10 Mar 2022

LiteTransformerSearch: Training-free Neural Architecture Search for Efficient Language ModelsNeural Information Processing Systems (NeurIPS), 2022

240

04 Mar 2022

ZeroGen: Efficient Zero-shot Learning via Dataset GenerationConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Jiacheng Ye

Jiahui Gao

Qintong Li

Hang Xu

Jiangtao Feng

Zhiyong Wu

Tao Yu

Lingpeng Kong

SyDa

344

275

16 Feb 2022

Quantifying Memorization Across Neural Language ModelsInternational Conference on Learning Representations (ICLR), 2022

506

778

15 Feb 2022

Fooling MOSS Detection with Pretrained Language ModelsInternational Conference on Information and Knowledge Management (CIKM), 2022

Stella Biderman

Edward Raff

DeLMO

172

19 Jan 2022

Counterfactual Memorization in Neural Language ModelsNeural Information Processing Systems (NeurIPS), 2021

318

169

24 Dec 2021

Generating More Pertinent Captions by Leveraging Semantics and Style on Multi-Source Datasets

Marcella Cornia

Lorenzo Baraldi

G. Fiameni

Rita Cucchiara

321

24 Nov 2021

How much do language models copy from their training data? Evaluating linguistic novelty in text generation using RAVEN

233

161

18 Nov 2021

Understanding Jargon: Combining Extraction and Generation for Definition ModelingConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Jie Huang

Hanyin Shao

Kevin Chen-Chuan Chang

Jinjun Xiong

Wen-mei W. Hwu

183

14 Nov 2021

Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel TrainingInternational Conference on Parallel Processing (ICPP), 2021

Yang You

297

190

28 Oct 2021

Can Machines Learn Morality? The Delphi Experiment

...

Yejin Choi

355

153

14 Oct 2021

Creativity and Machine Learning: A SurveyACM Computing Surveys (CSUR), 2021

Giorgio Franceschelli

Mirco Musolesi

VLM AI4CE

554

06 Apr 2021

Graphmax for Text GenerationJournal of Artificial Intelligence Research (JAIR), 2021

Bin Liu

Guosheng Yin

218

01 Jan 2021

NarrativeTime: Dense Temporal Annotation on a TimelineInternational Conference on Language Resources and Evaluation (LREC), 2019

180

29 Aug 2019