v1v2v3 (latest)

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

22 April 2024

Ahmed Hassan Awadallah

Jianmin Bao

Xin Jin

Yunsheng Li

Fan Yang

Jianwei Yang

Lu Yuan

Yue Zhang

ArXiv (abs)PDF HTML HuggingFace (257 upvotes)

Papers citing "Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone"

50 / 966 papers shown

Cool-Fusion: Fuse Large Language Models without TrainingAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

385

29 Jul 2024

Urban Safety Perception Assessments via Integrating Multimodal Large Language Models with Street View ImagesCities (Cities), 2024

263

29 Jul 2024

Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget

244

22 Jul 2024

MINI-SEQUENCE TRANSFORMER: Optimizing Intermediate Memory for Long Sequences Training

266

22 Jul 2024

Compact Language Models via Pruning and Knowledge Distillation

Saurav Muralidharan

Sharath Turuvekere Sreenivas

357

117

19 Jul 2024

Data-Centric Human Preference with Rationales for Direct Preference Alignment

527

19 Jul 2024

What's Wrong? Refining Meeting Summaries with LLM Feedback

Frederic Kirstein

Terry Ruas

Bela Gipp

301

16 Jul 2024

Does Refusal Training in LLMs Generalize to the Past Tense?

Maksym Andriushchenko

Nicolas Flammarion

572

16 Jul 2024

VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models

...

734

359

16 Jul 2024

DOCBENCH: A Benchmark for Evaluating LLM-based Document Reading Systems

Wenhao Yu

Kaixin Ma

Dong Yu

197

15 Jul 2024

Uncovering Semantics and Topics Utilized by Threat Actors to Deliver Malicious Attachments and URLs

Andrey Yakymovych

Abhishek Singh

11 Jul 2024

Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist

Xiaowei Huang

Qiufeng Wang

Kaizhu Huang

ELM LRM

257

11 Jul 2024

Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents

586

11 Jul 2024

Are Large Language Models Really Bias-Free? Jailbreak Prompts for Assessing Adversarial Robustness to Bias Elicitation

365

11 Jul 2024

Teaching Transformers Causal Reasoning through Axiomatic Training

Aniket Vashishtha

Abhinav Kumar

Atharva Pandey

Abbavaram Gowtham Reddy

Amit Sharma

Vineeth N. Balasubramanian

Amit Sharma

425

10 Jul 2024

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

Chen Qian

332

09 Jul 2024

What's Wrong with Your Code Generated by Large Language Models? An Extensive Study

...

285

08 Jul 2024

Evaluating Language Models for Generating and Judging Programming Feedback

188

05 Jul 2024

Rethinking Visual Prompting for Multimodal Large Language Models with External Knowledge

Dongdong Chen

228

05 Jul 2024

Stephanie: Step-by-Step Dialogues for Mimicking Human Interactions in Social Conversations

Hao Yang

Hongyuan Lu

Xinhua Zeng

Yang Liu

Xiang Zhang

Haoran Yang

Yumeng Zhang

Shan Huang

Yiran Wei

Wai Lam

232

04 Jul 2024

IncogniText: Privacy-enhancing Conditional Text Anonymization via LLM-based Private Attribute Randomization

263

03 Jul 2024

UnSeenTimeQA: Time-Sensitive Question-Answering Beyond LLMs' Memorization

504

03 Jul 2024

Can Small Language Models Learn, Unlearn, and Retain Noise Patterns?

Nicy Scaria

Silvester John Joseph Kennedy

Deepak N. Subramani

374

01 Jul 2024

MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs

672

01 Jul 2024

Too Late to Train, Too Early To Use? A Study on Necessity and Viability of Low-Resource Bengali LLMs

Khondker Salman Sayeed

Haz Sameen Shahgir

233

29 Jun 2024

Scaling Synthetic Data Creation with 1,000,000,000 Personas

577

277

28 Jun 2024

OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding

Tao Zhang

Xiangtai Li

Hao Fei

Chen Change Loy

329

123

27 Jun 2024

Learning to Correct for QA Reasoning with Black-box LLMs

Jaehyung Kim

Dongyoung Kim

Yiming Yang

LRM

250

26 Jun 2024

MG-LLaVA: Towards Multi-Granularity Visual Instruction Tuning

Xiangyu Zhao

Xiangtai Li

Haodong Duan

Haian Huang

Yining Li

Kai Chen

Hua Yang

VLM MLLM

335

25 Jun 2024

VarBench: Robust Language Model Benchmarking Through Dynamic Variable Perturbation

341

25 Jun 2024

DARG: Dynamic Evaluation of Large Language Models via Adaptive Reasoning Graph

228

25 Jun 2024

Task Oriented In-Domain Data Augmentation

Yeyun Gong

194

24 Jun 2024

Evaluation of Language Models in the Medical Context Under Resource-Constrained Settings

238

24 Jun 2024

Can Tool-augmented Large Language Models be Aware of Incomplete Conditions?

469

18 Jun 2024

A Label is Worth a Thousand Images in Dataset DistillationNeural Information Processing Systems (NeurIPS), 2024

Tian Qin

Zhiwei Deng

David Alvarez-Melis

457

15 Jun 2024

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-HaystackNeural Information Processing Systems (NeurIPS), 2024

Artyom Sorokin

RALM ALM LRM ReLM ELM

282

151

14 Jun 2024

First Multi-Dimensional Evaluation of Flowchart Comprehension for Multimodal Large Language Models

263

14 Jun 2024

VideoGPT+: Integrating Image and Video Encoders for Enhanced Video Understanding

Salman Khan

263

102

13 Jun 2024

LLM Reading Tea Leaves: Automatically Evaluating Topic Models with Large Language Models

416

13 Jun 2024

AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models

358

13 Jun 2024

Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing

Yejin Choi

Bill Yuchen Lin

SyDa

355

259

12 Jun 2024

Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling

Yadong Lu

Weizhu Chen

385

115

11 Jun 2024

Hints-In-Browser: Benchmarking Language Models for Programming Feedback GenerationNeural Information Processing Systems (NeurIPS), 2024

299

07 Jun 2024

A Survey on Large Language Models for Code Generation

Fan Wang

545

526

01 Jun 2024

OR-Bench: An Over-Refusal Benchmark for Large Language Models

737

31 May 2024

ReMoDetect: Reward Models Recognize Aligned LLM's Generations

293

27 May 2024

How many samples are needed to train a deep neural network?

Pegah Golestaneh

Mahsa Taheri

Johannes Lederer

245

26 May 2024

Small Language Models for Application Interactions: A Case Study

258

23 May 2024

Super Tiny Language Models

Cheston Tan

Bobby Cheng

294

23 May 2024

Curriculum Direct Preference Optimization for Diffusion and Consistency Models

Florinel-Alin Croitoru

631

22 May 2024