Qwen Technical Report

28 September 2023

Jinze Bai

Shuai Bai

Yunfei Chu

Zeyu Cui

Kai Dang

Xiaodong Deng

Yang Fan

Wenbin Ge

Yu Han

Fei Huang

Binyuan Hui

Luo Ji

Mei Li

Junyang Lin

Runji Lin

Dayiheng Liu

Gao Liu

Chengqiang Lu

Keming Lu

Jianxin Ma

Rui Men

Xingzhang Ren

Xuancheng Ren

Chuanqi Tan

Sinan Tan

Jianhong Tu

Peng Wang

Shijie Wang

Wei Wang

Shengguang Wu

Benfeng Xu

Jin Xu

An Yang

Hao Yang

Jian Yang

Shusheng Yang

Yang Yao

Bowen Yu

Hongyi Yuan

Zheng Yuan

Jianwei Zhang

Xinyu Zhang

Yichang Zhang

Zhenru Zhang

Chang Zhou

Jingren Zhou

Xiaohuan Zhou

Tianhang Zhu

OSLM

ArXiv (abs)PDF HTML HuggingFace (36 upvotes)

Papers citing "Qwen Technical Report"

50 / 1,888 papers shown

DeCo: Decoupling Token Compression from Semantic Abstraction in Multimodal Large Language Models

Lei Li

216

31 May 2024

Enhancing Noise Robustness of Retrieval-Augmented Language Models with Adaptive Adversarial Training

Ruifeng Xu

354

31 May 2024

Provably Efficient Interactive-Grounded Learning with Personalized Reward

208

31 May 2024

OR-Bench: An Over-Refusal Benchmark for Large Language Models

738

31 May 2024

Mind the Inconspicuous: Revealing the Hidden Weakness in Aligned LLMs' Refusal Boundaries

329

31 May 2024

Unveiling the Impact of Coding Data Instruction Fine-Tuning on Large Language Models Reasoning

340

30 May 2024

Auto Arena of LLMs: Automating LLM Evaluations with Agent Peer-battles and Committee Discussions

268

30 May 2024

TAIA: Large Language Models are Out-of-Distribution Data Learners

229

30 May 2024

Would I Lie To You? Inference Time Alignment of Language Models using Direct Preference Heads

Avelina Asada Hadji-Kyriacou

Ognjen Arandjelović

154

30 May 2024

MAP-Neo: Highly Capable and Transparent Bilingual Large Language Model Series

Ge Zhang

Jiaheng Liu

...

Wanli Ouyang

318

29 May 2024

PediatricsGPT: Large Language Models as Chinese Medical Assistants for Pediatric Applications

Dingkang Yang

...

Peng Zhai

Lihua Zhang

LM&MA

322

29 May 2024

Evaluating the External and Parametric Knowledge Fusion of Large Language Models

...

Lifeng Shang

Qun Liu

Yong Liu

Ruiming Tang

KELM

246

29 May 2024

ViG: Linear-complexity Visual Sequence Learning with Gated Linear Attention

310

28 May 2024

fMRI predictors based on language models of increasing complexity recover brain left lateralization

Laurent Bonnasse-Gahot

Christophe Pallier

154

28 May 2024

Exploring Activation Patterns of Parameters in Language Models

Yudong Wang

Damai Dai

Zhifang Sui

173

28 May 2024

$C$^{3}$Bench: A Comprehensive Classical Chinese Understanding Benchmark for Large Language Models$

^{3}

Bench: A Comprehensive Classical Chinese Understanding Benchmark for Large Language Models

Lianwen Jin

232

28 May 2024

Recent advances in text embedding: A Comprehensive Review of Top-Performing Methods on the MTEB Benchmark

Hongliu Cao

AI4TS

331

27 May 2024

Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization

491

27 May 2024

ReflectionCoder: Learning from Reflection Sequence for Enhanced One-off Code Generation

415

27 May 2024

TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation

419

27 May 2024

Automatically Generating Numerous Context-Driven SFT Data for LLMs across Diverse Granularity

Shanghaoran Quan

244

26 May 2024

SED: Self-Evaluation Decoding Enhances Large Language Models for Better Generation

Guochao Jiang

Yanghua Xiao

166

26 May 2024

ConStat: Performance-Based Contamination Detection in Large Language Models

Jasper Dekoninck

Mark Niklas Muller

Martin Vechev

167

25 May 2024

Streaming Long Video Understanding with Large Language Models

Dahua Lin

257

113

25 May 2024

GECKO: Generative Language Model for English, Code and Korean

Sungwoo Oh

Donggyu Kim

VLM

181

24 May 2024

Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving

Jianbiao Mei

Yukai Ma

Xuemeng Yang

Licheng Wen

...

Yu Qiao

196

24 May 2024

Linearly Controlled Language Generation with Performative Guarantees

Emily Cheng

Marco Baroni

378

24 May 2024

Everything is Editable: Extend Knowledge Editing to Unstructured Data in Large Language Models

238

24 May 2024

M4U: Evaluating Multilingual Understanding and Reasoning for Large Multimodal Models

411

24 May 2024

Bayesian WeakS-to-Strong from Text Classification to Generation

367

24 May 2024

AGRaME: Any-Granularity Ranking with Multi-Vector Embeddings

Heng Ji

146

23 May 2024

Extracting Prompts by Inverting LLM Outputs

Collin Zhang

John X. Morris

Vitaly Shmatikov

233

23 May 2024

Linking In-context Learning in Transformers to Human Episodic Memory

171

23 May 2024

AnalogCoder: Analog Circuit Design via Training-Free Code GenerationAAAI Conference on Artificial Intelligence (AAAI), 2024

Ping Luo

335

23 May 2024

Base of RoPE Bounds Context LengthNeural Information Processing Systems (NeurIPS), 2024

Xianpei Han

239

23 May 2024

JiuZhang3.0: Efficiently Improving Mathematical Reasoning by Training Small Data Synthesis ModelsNeural Information Processing Systems (NeurIPS), 2024

329

23 May 2024

Focus Anywhere for Fine-grained Multi-page Document Understanding

Chenglong Liu

Haoran Wei

Jinyue Chen

Lingyu Kong

Zheng Ge

Zining Zhu

Liang Zhao

Jian‐Yuan Sun

Chunrui Han

Xiangyu Zhang

177

23 May 2024

Federated Domain-Specific Knowledge Transfer on Large Language Models Using Synthetic Data

Hanlin Gu

195

23 May 2024

Super Tiny Language Models

Cheston Tan

Bobby Cheng

294

23 May 2024

Unveiling the Tapestry of Consistency in Large Vision-Language ModelsNeural Information Processing Systems (NeurIPS), 2024

Yuan Zhang

341

23 May 2024

Getting More from Less: Large Language Models are Good Spontaneous
Multilingual Learners

246

22 May 2024

Dense Connector for MLLMs

Yifan Sun

Wanli Ouyang

Jingdong Wang

MLLM VLM

224

22 May 2024

ECLIPSE: Semantic Entropy-LCS for Cross-Lingual Industrial Log Parsing

Hongcheng Guo

...

238

22 May 2024

360Zhinao Technical Report

360Zhinao Team

221

22 May 2024

CG-FedLLM: How to Compress Gradients in Federated Fune-tuning for Large Language Models

278

22 May 2024

MathBench: Evaluating the Theory and Application Proficiency of LLMs with a Hierarchical Mathematics Benchmark

Yuxuan Qiao

Dahua Lin

231

116

20 May 2024

Imp: Highly Capable Large Multimodal Models for Mobile Devices

272

20 May 2024

MTVQA: Benchmarking Multilingual Text-Centric Visual Question Answering

...

793

20 May 2024

(Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts

600

20 May 2024

Uni-MoE: Scaling Unified Multimodal LLMs with Mixture of ExpertsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

Baotian Hu

Lin Ma

238

100

18 May 2024