v1v2v3v4 (latest)

OPT: Open Pre-trained Transformer Language Models

2 May 2022

Xian Li

Luke Zettlemoyer

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "OPT: Open Pre-trained Transformer Language Models"

50 / 2,924 papers shown

Exploring the Use of Large Language Models for Reference-Free Text Quality Evaluation: An Empirical StudyInternational Joint Conference on Natural Language Processing (IJCNLP), 2023

Ruifeng Xu

423

116

03 Apr 2023

LLMMaps -- A Visual Metaphor for Stratified Evaluation of Large Language Models

Patrik Puchert

Poonam Poonam

Christian van Onzenoodt

Timo Ropinski

153

02 Apr 2023

Evaluating Large Language Models on a Highly-specialized Topic, Radiation Oncology PhysicsFrontiers in Oncology (Front Oncol), 2023

...

Xiang Li

Tianming Liu

Jiajian Shen

Wen Liu

LM&MA AI4CE ELM

234

144

01 Apr 2023

Evaluating GPT-4 and ChatGPT on Japanese Medical Licensing Examinations

Keisuke Sakaguchi

178

123

31 Mar 2023

CAMEL: Communicative Agents for "Mind" Exploration of Large Language Model SocietyNeural Information Processing Systems (NeurIPS), 2023

580

977

31 Mar 2023

HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging FaceNeural Information Processing Systems (NeurIPS), 2023

Yongliang Shen

Kaitao Song

Xu Tan

Dongsheng Li

Weiming Lu

Yueting Zhuang

MLLM

1.1K

1,240

30 Mar 2023

CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Benchmarking on HumanEval-XKnowledge Discovery and Data Mining (KDD), 2023

Yuxiao Dong

...

400

474

30 Mar 2023

BloombergGPT: A Large Language Model for Finance

686

1,157

30 Mar 2023

Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual Mask AnnotationsComputer Vision and Pattern Recognition (CVPR), 2023

Ran Xu

252

29 Mar 2023

An Over-parameterized Exponential Regression

Yeqi Gao

Sridhar Mahadevan

Zhao Song

270

29 Mar 2023

Larger Probes Tell a Different Story: Extending Psycholinguistic Datasets Via In-Context LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Namrata Shivagunde

Vladislav Lialin

Anna Rumshisky

364

29 Mar 2023

InceptionNeXt: When Inception Meets ConvNeXtComputer Vision and Pattern Recognition (CVPR), 2023

544

268

29 Mar 2023

LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention

Yu Qiao

590

943

28 Mar 2023

Training Language Models with Language Feedback at Scale

359

123

28 Mar 2023

Hallucinations in Large Multilingual Translation ModelsTransactions of the Association for Computational Linguistics (TACL), 2023

416

203

28 Mar 2023

Unmasked Teacher: Towards Training-Efficient Video Foundation ModelsIEEE International Conference on Computer Vision (ICCV), 2023

Yi Wang

Yu Qiao

536

238

28 Mar 2023

Solving Regularized Exp, Cosh and Sinh Regression Problems

Zhihang Li

Zhao Song

Wanrong Zhu

211

28 Mar 2023

Foundation Models and Fair UseJournal of machine learning research (JMLR), 2023

Peter Henderson

Xuechen Li

Dan Jurafsky

Tatsunori Hashimoto

Christopher De Sa

Abigail Z. Jacobs

187

161

28 Mar 2023

Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning

Vladislav Lialin

Vijeta Deshpande

Anna Rumshisky

325

238

28 Mar 2023

Unlocking the Potential of ChatGPT: A Comprehensive Exploration of its Applications, Advantages, Limitations, and Future Directions in Natural Language Processing

Walid Hariri

AI4MH LM&MA

909

120

27 Mar 2023

Unified Text Structuralization with Instruction-tuned Language Models

Xuanfan Ni

Piji Li

Huayang Li

240

27 Mar 2023

Koala: An Index for Quantifying Overlaps with Pre-training CorporaConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Ehsan Shareghi

177

26 Mar 2023

Exploring the Impact of Instruction Data Scaling on Large Language Models: An Empirical Study on Real-World Use Cases

Xiangang Li

179

116

26 Mar 2023

No more Reviewer #2: Subverting Automatic Paper-Reviewer Assignment using Adversarial LearningUSENIX Security Symposium (USENIX Security), 2023

244

25 Mar 2023

Scaling Expert Language Models with Unsupervised Domain Discovery

Weijia Shi

Luke Zettlemoyer

274

24 Mar 2023

$k$NN Prompting: Beyond-Context Learning with Calibration-Free Nearest
Neighbor Inference

k

NN Prompting: Beyond-Context Learning with Calibration-Free Nearest Neighbor InferenceInternational Conference on Learning Representations (ICLR), 2023

Benfeng Xu

308

24 Mar 2023

Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defenseNeural Information Processing Systems (NeurIPS), 2023

357

439

23 Mar 2023

Fundamentals of Generative Large Language Models and Perspectives in Cyber-Defense

Andrei Kucharavy

171

21 Mar 2023

CompoDiff: Versatile Composed Image Retrieval With Latent Diffusion

555

21 Mar 2023

Multi-modal Prompting for Low-Shot Temporal Action Localization

201

21 Mar 2023

Large AI Models in Health Informatics: Applications, Challenges, and the FutureIEEE journal of biomedical and health informatics (IEEE JBHI), 2023

...

Wu Yuan

285

185

21 Mar 2023

Language Model Behavior: A Comprehensive SurveyInternational Conference on Computational Logic (ICCL), 2023

Tyler A. Chang

Benjamin Bergen

VLM LRM LM&MA

381

141

20 Mar 2023

eP-ALM: Efficient Perceptual Augmentation of Language ModelsIEEE International Conference on Computer Vision (ICCV), 2023

424

20 Mar 2023

CLIP goes 3D: Leveraging Prompt Tuning for Language Grounded 3D Recognition

Deepti Hegde

Jeya Maria Jose Valanarasu

Vishal M. Patel

CLIP

427

20 Mar 2023

PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing

...

Xin Jiang

Qun Liu

242

20 Mar 2023

DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4

...

297

211

20 Mar 2023

Large Language Model Instruction Following: A Survey of Progresses and ChallengesComputational Linguistics (CL), 2023

856

18 Mar 2023

A Comprehensive Capability Analysis of GPT-3 and GPT-3.5 Series Models

...

Jie Zhou

Siming Chen

Tao Gui

Xuanjing Huang

ELM

313

444

18 Mar 2023

Instance-Conditioned GAN Data Augmentation for Representation Learning

Pietro Astolfi

Arantxa Casanova

Jakob Verbeek

Pascal Vincent

Adriana Romero Soriano

M. Drozdzal

220

16 Mar 2023

SemDeDup: Data-efficient learning at web-scale through semantic deduplication

305

243

16 Mar 2023

DeltaScore: Fine-Grained Story Evaluation with PerturbationsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

391

15 Mar 2023

SelfCheckGPT: Zero-Resource Black-Box Hallucination Detection for Generative Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Potsawee Manakul

Adian Liusie

Mark Gales

HILM LRM

424

692

15 Mar 2023

UPRISE: Universal Prompt Retrieval for Improving Zero-Shot EvaluationConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Yujing Wang

238

15 Mar 2023

MCR-DL: Mix-and-Match Communication Runtime for Deep LearningIEEE International Parallel and Distributed Processing Symposium (IPDPS), 2023

Yuxiong He

Hari Subramoni

130

15 Mar 2023

ZeroQuant-V2: Exploring Post-training Quantization in LLMs from Comprehensive Study to Low Rank Compensation

Yuxiong He

388

15 Mar 2023

The Life Cycle of Knowledge in Big Language Models: A SurveyMachine Intelligence Research (MIR), 2023

Xianpei Han

266

14 Mar 2023

Exploring ChatGPT's Ability to Rank Content: A Preliminary Study on Consistency with Human Preferences

Xiangang Li

126

14 Mar 2023

Eliciting Latent Predictions from Transformers with the Tuned Lens

669

320

14 Mar 2023

Transformer Models for Acute Brain Dysfunction Prediction

132

13 Mar 2023

FlexGen: High-Throughput Generative Inference of Large Language Models with a Single GPUInternational Conference on Machine Learning (ICML), 2023

...

454

585

13 Mar 2023