v1v2v3 (latest)

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

22 April 2024

Ahmed Hassan Awadallah

Jianmin Bao

Xin Jin

Yunsheng Li

Fan Yang

Jianwei Yang

Lu Yuan

Yue Zhang

ArXiv (abs)PDF HTML HuggingFace (257 upvotes)

Papers citing "Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone"

50 / 972 papers shown

Efficient Low Rank Attention for Long-Context Inference in Large Language Models

465

24 Dec 2025

David vs. Goliath: Can Small Models Win Big with Agentic AI in Hardware Design?

Shashwat Shankar

Subhranshu Pandey

Innocent Dengkhw Mochahari

Bhabesh Mali

Animesh Basak Chowdhury

Sukanta Bhattacharjee

C. Karfa

LM&Ro AI4CE

243

04 Dec 2025

Jina-VLM: Small Multilingual Vision Language Model

417

03 Dec 2025

ChromouVQA: Benchmarking Vision-Language Models under Chromatic Camouflaged Images

173

30 Nov 2025

ChartPoint: Guiding MLLMs with Grounding Reflection for Chart Reasoning

287

29 Nov 2025

Unexplored flaws in multiple-choice VQA evaluations

27 Nov 2025

Can Multi-Modal LLMs Provide Live Step-by-Step Task Guidance?

Apratim Bhattacharyya

127

27 Nov 2025

AfriStereo: A Culturally Grounded Dataset for Evaluating Stereotypical Bias in Large Language Models

Yann Le Beux

Oluchi Audu

Oche D. Ankeli

Dhananjay Balakrishnan

Melissah Weya

Marie D. Ralaiarinosy

Ignatius Ezeani

133

27 Nov 2025

HKRAG: Holistic Knowledge Retrieval-Augmented Generation Over Visually-Rich Documents

136

25 Nov 2025

RubricRL: Simple Generalizable Rewards for Text-to-Image Generation

312

25 Nov 2025

MGA-VQA: Secure and Interpretable Graph-Augmented Visual Question Answering with Memory-Guided Protection Against Unauthorized Knowledge Use

Ahmad Mohammadshirazi

Pinaki Prasad Guha Neogi

Dheeraj Kulshrestha

R. Ramnath

112

22 Nov 2025

Downscaling Intelligence: Exploring Perception and Reasoning Bottlenecks in Small Multimodal Models

Mark Endo

Serena Yeung-Levy

LRM

270

21 Nov 2025

SAM 3D: 3Dfy Anything in Images

...

419

20 Nov 2025

Fifty Shades of Greenwashing: The Political Economy of Climate Change Advertising on Social Media

Robert Kubinec

Aseem Mahajan

117

18 Nov 2025

Attention Grounded Enhancement for Visual Document Retrieval

203

17 Nov 2025

Detecting and Steering LLMs' Empathy in Action

Juan P. Cadile

LLMSV

155

17 Nov 2025

TZ-LLM: Protecting On-Device Large Language Models with Arm TrustZone

114

17 Nov 2025

Structured Definitions and Segmentations for Legal Reasoning in LLMs: A Study on Indian Legal Data

Mann Khatri

Mirza Yusuf

R. Shah

Ponnurangam Kumaraguru

AILaw ELM

243

14 Nov 2025

Think-at-Hard: Selective Latent Iterations to Improve Reasoning Language Models

222

11 Nov 2025

Revisiting NLI: Towards Cost-Effective and Human-Aligned Metrics for Evaluating LLMs in Question Answering

Sai Shridhar Balamurali

Lu Cheng

152

10 Nov 2025

Sensitivity of Small Language Models to Fine-tuning Data Contamination

Nicy Scaria

Silvester John Joseph Kennedy

Deepak N. Subramani

109

10 Nov 2025

Towards Resource-Efficient Multimodal Intelligence: Learned Routing among Specialized Expert Models

Mayank Saini

Arit Kumar Bishwas

MoE

137

09 Nov 2025

ThaiOCRBench: A Task-Diverse Benchmark for Vision-Language Understanding in Thai

Chanakan Wittayasakpan

Warit Sirichotedumrong

Adisai Na-Thalang

Kunat Pipatanakul

VLM

329

06 Nov 2025

UTF-8 Plumbing: Byte-level Tokenizers Unavoidably Enable LLMs to Generate Ill-formed UTF-8

110

05 Nov 2025

From Prompts to Power: Measuring the Energy Footprint of LLM Inference

Francisco Caravaca

Ángel Cuevas

R. Cuevas

135

05 Nov 2025

Contamination Detection for VLMs using Multi-Modal Semantic Perturbation

113

05 Nov 2025

Assessing LLM Reasoning Steps via Principal Knowledge GroundingConference on Empirical Methods in Natural Language Processing (EMNLP), 2025

325

02 Nov 2025

ShadowLogic: Backdoors in Any Whitebox LLM

268

01 Nov 2025

RzenEmbed: Towards Comprehensive Multimodal Retrieval

161

31 Oct 2025

ChartAB: A Benchmark for Chart Grounding & Dense Alignment

217

30 Oct 2025

Optimizing Retrieval for RAG via Reinforcement Learning

Jiawei Zhou

Lei Chen

169

28 Oct 2025

A Survey on LLM Mid-Training

281

27 Oct 2025

Lightweight Robust Direct Preference Optimization

160

27 Oct 2025

DynaStride: Dynamic Stride Windowing with MMCoT for Instructional Multi-Scene Captioning

169

27 Oct 2025

Agentic Meta-Orchestrator for Multi-task Copilots

Xiaofeng Zhu

Yunshen Zhou

LLMAG

311

26 Oct 2025

Human-Inspired Neuro-Symbolic World Modeling and Logic Reasoning for Interpretable Safe UAV Landing Site Assessment

123

25 Oct 2025

Flight Delay Prediction via Cross-Modality Adaptation of Large Language Models and Aircraft Trajectory Representation

Thaweerath Phisannupawong

J. J. Damanik

Han-Lim Choi

188

24 Oct 2025

Knowledge Distillation of Uncertainty using Deep Latent Factor Model

411

22 Oct 2025

Unified Reinforcement and Imitation Learning for Vision-Language Models

185

22 Oct 2025

I Large Language Models possono nascondere un testo in un altro testo della stessa lunghezza

Antonio Norelli

Michael Bronstein

323

22 Oct 2025

Multilingual Text-to-Image Person Retrieval via Bidirectional Relation Reasoning and AligningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

205

20 Oct 2025

An Evaluation of LLMs Inference on Popular Single-board Computers

Tung

Nguyen

T. Nguyen

121

20 Oct 2025

Modeling Expert Interactions in Sparse Mixture of Experts via Graph Structures

Minh Khoi Nguyen Nhat

196

18 Oct 2025

Train a Unified Multimodal Data Quality Classifier with Synthetic Data

104

16 Oct 2025

MaskCaptioner: Learning to Jointly Segment and Caption Object Trajectories in Videos

474

16 Oct 2025

Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs

Minji Kim

Taekyung Kim

Bohyung Han

116

15 Oct 2025

SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model

...

271

14 Oct 2025

Find Your Optimal Teacher: Personalized Data Synthesis via Router-Guided Multi-Teacher Distillation

...

190

13 Oct 2025

Preserving LLM Capabilities through Calibration Data Curation: From Analysis to Optimization

136

12 Oct 2025

Bridging Semantics & Structure for Software Vulnerability Detection using Hybrid Network Models

Jugal Gajjar

Kaustik Ranaware

Kamalasankari Subramaniakuppusamy

11 Oct 2025