v1v2v3v4 (latest)

OPT: Open Pre-trained Transformer Language Models

2 May 2022

Xian Li

Luke Zettlemoyer

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "OPT: Open Pre-trained Transformer Language Models"

50 / 2,922 papers shown

APT-LLM: Exploiting Arbitrary-Precision Tensor Core Computing for LLM AccelerationIEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems (TCAD), 2025

124

26 Aug 2025

Task-Stratified Knowledge Scaling Laws for Post-Training Quantized Large Language Models

Jun Zhao

Kang Liu

196

26 Aug 2025

Better Language Model-Based Judging Reward Modeling through Scaling Comprehension Boundaries

132

25 Aug 2025

Dynamic Sparse Attention on Mobile SoCs

162

22 Aug 2025

Interpreting the Effects of Quantization on LLMs

Manpreet Singh

Hassan Sajjad

MQ MILM

382

22 Aug 2025

Subjective Behaviors and Preferences in LLM: Language of Browsing

246

21 Aug 2025

Discrete Optimization of Min-Max Violation and its Applications Across Computational Sciences

135

19 Aug 2025

Two Birds with One Stone: Multi-Task Detection and Attribution of LLM-Generated Text

176

19 Aug 2025

GLASS: Test-Time Acceleration for LLMs via Global-Local Neural Importance Aggregation

Amirmohsen Sattarifard

107

19 Aug 2025

Z-Pruner: Post-Training Pruning of Large Language Models for Efficiency without Retraining

Samiul Basir Bhuiyan

Md. Sazzad Hossain Adib

Mohammed Aman Bhuiyan

Muhammad Rafsan Kabir

Moshiur Farazi

Shafin Rahman

Nabeel Mohammed

180

18 Aug 2025

The Cultural Gene of Large Language Models: A Study on the Impact of Cross-Corpus Training on Model Values and Biases

Emanuel Z. Fenech-Borg

Tilen P. Meznaric-Kos

Milica D. Lekovic-Bojovic

Arni J. Hentze-Djurhuus

253

17 Aug 2025

STEM: Efficient Relative Capability Evaluation of LLMs through Structured Transition Samples

124

16 Aug 2025

A Survey on Diffusion Language Models

319

14 Aug 2025

Puppeteer: Rig and Animate Your 3D Models

110

14 Aug 2025

A Study of Commonsense Reasoning over Visual Object Properties

Abhishek Kolari

Mohammadhossein Khojasteh

233

14 Aug 2025

Unpacking the Implicit Norm Dynamics of Sharpness-Aware Minimization in Tensorized Models

Tianxiao Cao

Kyohei Atarashi

H. Kashima

230

14 Aug 2025

Shadow in the Cache: Unveiling and Mitigating Privacy Risks of KV-cache in LLM Inference

240

13 Aug 2025

VertexRegen: Mesh Generation with Continuous Level of Detail

12 Aug 2025

SinLlama -- A Large Language Model for SinhalaMoratuwa Engineering Research Conference (MERCon), 2025

290

12 Aug 2025

Semantic-Enhanced Time-Series Forecasting via Large Language Models

246

11 Aug 2025

Efficient Edge LLMs Deployment via HessianAware Quantization and CPU GPU Collaborative

130

10 Aug 2025

Rethinking 1-bit Optimization Leveraging Pre-trained Large Language Models

127

09 Aug 2025

Fed MobiLLM: Efficient Federated LLM Fine-Tuning over Heterogeneous Mobile Devices via Server Assisted Side-Tuning

121

09 Aug 2025

Decision-Making with Deliberation: Meta-reviewing as a Document-grounded Dialogue

104

07 Aug 2025

A Survey on Video Temporal Grounding with Multimodal Large Language ModelIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

145

07 Aug 2025

FlexQ: Efficient Post-training INT6 Quantization for LLM Serving via Algorithm-System Co-Design

131

06 Aug 2025

Share Your Attention: Transformer Weight Sharing via Matrix-based Dictionary Learning

Magauiya Zhussip

Dmitriy Shopkhoev

Ammar Ali

Stamatios Lefkimmiatis

112

06 Aug 2025

CTR-Sink: Attention Sink for Language Models in Click-Through Rate Prediction

...

136

05 Aug 2025

MegaWika 2: A More Comprehensive Multilingual Collection of Articles and their Sources

186

05 Aug 2025

When Truth Is Overridden: Uncovering the Internal Origins of Sycophancy in Large Language Models

452

04 Aug 2025

Context-Adaptive Multi-Prompt Embedding with Large Language Models for Vision-Language Alignment

Dahun Kim

A. Angelova

VLM

209

03 Aug 2025

Mitigating Information Loss under High Pruning Rates for Efficient Large Vision Language Models

168

02 Aug 2025

FlashSVD: Memory-Efficient Inference with Streaming for Low-Rank Models

119

02 Aug 2025

A Bayesian Hybrid Parameter-Efficient Fine-Tuning Method for Large Language Models

31 Jul 2025

Shapley Uncertainty in Natural Language Generation

151

29 Jul 2025

When Truthful Representations Flip Under Deceptive Instructions?

373

29 Jul 2025

Adversarial Defence without Adversarial Defence: Enhancing Language Model Robustness via Instance-level Principal Component Removal

304

29 Jul 2025

FMimic: Foundation Models are Fine-grained Action Learners from Human VideosThe international journal of robotics research (IJRR), 2025

...

158

28 Jul 2025

Do Large Language Models Understand Morality Across Cultures?

Hadi Mohammadi

Yasmeen F.S.S. Meijer

Efthymia Papadopoulou

Ayoub Bagheri

214

28 Jul 2025

Flora: Effortless Context Construction to Arbitrary Length and Scale

253

26 Jul 2025

HCAttention: Extreme KV Cache Compression via Heterogeneous Attention Computing for LLMs

173

26 Jul 2025

The Carbon Cost of Conversation, Sustainability in the Age of Language Models

Sayed Mahbub Hasan Amiri

Prasun Goswami

Md. Mainul Islam

Mohammad Shakhawat Hossen

Sayed Majhab Hasan Amiri

Naznin Akter

SILM SyDa

260

26 Jul 2025

A Survey on Generative Model Unlearning: Fundamentals, Taxonomy, Evaluation, and Future Direction

262

26 Jul 2025

MLLM-based Speech Recognition: When and How is Multimodality Beneficial?

222

25 Jul 2025

Modality Agnostic Efficient Long Range Encoder

T. Parag

Ahmed Elgammal

158

25 Jul 2025

SLoW: Select Low-frequency Words! Automatic Dictionary Selection for Translation on Large Language Models

127

25 Jul 2025

BucketServe: Bucket-Based Dynamic Batching for Smart and Efficient LLM Inference Serving

145

23 Jul 2025

FedChip: Federated LLM for Artificial Intelligence Accelerator Chip Design

134

23 Jul 2025

Spatial 3D-LLM: Exploring Spatial Awareness in 3D Vision-Language Models

130

22 Jul 2025

Discrete Tokenization for Multimodal LLMs: A Comprehensive Survey

157

21 Jul 2025