Title
FIPO: Free-form Instruction-oriented Prompt Optimization with Preference Dataset and Modular Fine-tuning Schema Junru Lu Siyu An Min Zhang Yulan He Di Yin Xing Sun 32 1 0 19 Feb 2024
Can Deception Detection Go Deeper? Dataset, Evaluation, and Benchmark for Deception Reasoning Kang Chen Zheng Lian Haiyang Sun Bin Liu Jianhua Tao 31 0 0 18 Feb 2024
LaCo: Large Language Model Pruning via Layer Collapse Yifei Yang Zouying Cao Hai Zhao 8 52 0 17 Feb 2024
When LLMs Meet Cunning Texts: A Fallacy Understanding Benchmark for Large Language Models Yinghui Li Qingyu Zhou Yuanzhen Luo Shirong Ma Yangning Li Hai-Tao Zheng Xuming Hu Philip S. Yu LRM 39 13 0 16 Feb 2024
Enhancing Role-playing Systems through Aggressive Queries: Evaluation and Improvement Yihong Tang Jiao Ou Che Liu Fuzheng Zhang Di Zhang Kun Gai 42 4 0 16 Feb 2024
Large Language Models as Zero-shot Dialogue State Tracker through Function Calling Zekun Li Zhiyu Zoey Chen Mike Ross Patrick Huber Seungwhan Moon Zhaojiang Lin Xin Luna Dong Adithya Sagar Xifeng Yan Paul A. Crook 25 21 0 16 Feb 2024
Data Engineering for Scaling Language Models to 128K Context Yao Fu Rameswar Panda Xinyao Niu Xiang Yue Hanna Hajishirzi Yoon Kim Hao-Chun Peng MoE 36 115 0 15 Feb 2024
MuChin: A Chinese Colloquial Description Benchmark for Evaluating Language Models in the Field of Music Zihao W. Wang Shuyu Li Tao Zhang Qi Wang Pengfei Yu Jinyang Luo Yan Liu Ming Xi Kejun Zhang 32 4 0 15 Feb 2024
AI Hospital: Benchmarking Large Language Models in a Multi-agent Medical Interaction Simulator Zhihao Fan Jialong Tang Wei Chen Siyuan Wang Zhongyu Wei Jun Xi Fei Huang Jingren Zhou LM&MA 38 19 0 15 Feb 2024
InfoRM: Mitigating Reward Hacking in RLHF via Information-Theoretic Reward Modeling Yuchun Miao Sen Zhang Liang Ding Rong Bao Lefei Zhang Dacheng Tao 22 12 0 14 Feb 2024
CPSDBench: A Large Language Model Evaluation Benchmark and Baseline for Chinese Public Security Domain Xin Tong Bo Jin Zhi Lin Binjun Wang Ting Yu Qiang Cheng ELM 17 0 0 11 Feb 2024
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models Chris Liu Renrui Zhang Longtian Qiu Siyuan Huang Weifeng Lin ... Hao Shao Pan Lu Hongsheng Li Yu Qiao Peng Gao MLLM 126 106 0 08 Feb 2024
PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition Jinghui Lu Ziwei Yang Yanjie Wang Xuejing Liu Brian Mac Namee Can Huang MoE 45 4 0 07 Feb 2024
Alirector: Alignment-Enhanced Chinese Grammatical Error Corrector Haihui Yang Xiaojun Quan 3DV 21 2 0 07 Feb 2024
HarmBench: A Standardized Evaluation Framework for Automated Red Teaming and Robust Refusal Mantas Mazeika Long Phan Xuwang Yin Andy Zou Zifan Wang ... Nathaniel Li Steven Basart Bo Li David A. Forsyth Dan Hendrycks AAML 16 308 0 06 Feb 2024
MobileVLM V2: Faster and Stronger Baseline for Vision Language Model Xiangxiang Chu Limeng Qiao Xinyu Zhang Shuang Xu Fei Wei ... Xiaofei Sun Yiming Hu Xinyang Lin Bo-Wen Zhang Chunhua Shen VLM MLLM 17 94 0 06 Feb 2024
Aligner: Efficient Alignment by Learning to Correct Jiaming Ji Boyuan Chen Hantao Lou Donghai Hong Borong Zhang Xuehai Pan Juntao Dai Tianyi Qiu Yaodong Yang 29 6 0 04 Feb 2024
Evaluating Large Language Models for Generalization and Robustness via Data Compression Yucheng Li Yunhao Guo Frank Guerin Chenghua Lin ELM 20 5 0 01 Feb 2024
Weak-to-Strong Jailbreaking on Large Language Models Xuandong Zhao Xianjun Yang Tianyu Pang Chao Du Lei Li Yu-Xiang Wang William Yang Wang 26 52 0 30 Jan 2024
InternLM-XComposer2: Mastering Free-form Text-Image Composition and Comprehension in Vision-Language Large Model Xiao-wen Dong Pan Zhang Yuhang Zang Yuhang Cao Bin Wang ... Conghui He Xingcheng Zhang Yu Qiao Dahua Lin Jiaqi Wang VLM MLLM 76 242 0 29 Jan 2024
Beyond Direct Diagnosis: LLM-based Multi-Specialist Agent Consultation for Automatic Diagnosis Hao Wang Sendong Zhao Zewen Qiang Nuwa Xi Bing Qin Ting Liu LM&MA 19 12 0 29 Jan 2024
MoE-LLaVA: Mixture of Experts for Large Vision-Language Models Bin Lin Zhenyu Tang Yang Ye Jiaxi Cui Bin Zhu ... Jinfa Huang Junwu Zhang Yatian Pang Munan Ning Li-ming Yuan VLM MLLM MoE 33 151 0 29 Jan 2024
E-EVAL: A Comprehensive Chinese K-12 Education Evaluation Benchmark for Large Language Models Jinchang Hou Chang Ao Haihong Wu Xiangtao Kong Zhigang Zheng ... Chengming Li Xiping Hu Ruifeng Xu Shiwen Ni Min Yang AI4Ed ELM 21 6 0 29 Jan 2024
PRE: A Peer Review Based Large Language Model Evaluator Zhumin Chu Qingyao Ai Yiteng Tu Haitao Li Yiqun Liu LRM ALM 28 21 0 28 Jan 2024
Baichuan2-Sum: Instruction Finetune Baichuan2-7B Model for Dialogue Summarization Jianfei Xiao Yancan Chen Yimin Ou Hanyi Yu Kai Shu Yiyong Xiao ALM 11 11 0 27 Jan 2024
F-Eval: Asssessing Fundamental Abilities with Refined Evaluation Methods Yu Sun Keyu Chen Shujie Wang Qipeng Guo Hang Yan Xipeng Qiu Xuanjing Huang Dahua Lin ELM 17 0 0 26 Jan 2024
Query of CC: Unearthing Large Scale Domain-Specific Knowledge from Public Corpora Zhaoye Fei Yunfan Shao Linyang Li Zhiyuan Zeng Conghui He Hang Yan Dahua Lin Xipeng Qiu 23 7 0 26 Jan 2024
Can AI Assistants Know What They Don't Know? Qinyuan Cheng Tianxiang Sun Xiangyang Liu Wenwei Zhang Zhangyue Yin Shimin Li Linyang Li Zhengfu He Kai Chen Xipeng Qiu 29 23 0 24 Jan 2024
Distilling Mathematical Reasoning Capabilities into Small Language Models Xunyu Zhu Jian Li Yong Liu Can Ma Weiping Wang LRM 29 9 0 22 Jan 2024
Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs Ling Yang Zhaochen Yu Chenlin Meng Minkai Xu Stefano Ermon Bin Cui CoGe DiffM 30 113 0 22 Jan 2024
Orion-14B: Open-source Multilingual Large Language Models Du Chen Yi Huang Xiaopu Li Yongqiang Li Yongqiang Liu Haihui Pan Leichao Xu Dacheng Zhang Zhipeng Zhang Kun Han 16 4 0 20 Jan 2024
FinSQL: Model-Agnostic LLMs-based Text-to-SQL Framework for Financial Analysis Chao Zhang Yuren Mao Yijiang Fan Yu Mi Yunjun Gao Lu Chen Dongfang Lou Jinshu Lin 21 22 0 19 Jan 2024
MLLM-Tool: A Multimodal Large Language Model For Tool Agent Learning Chenyu Wang Weixin Luo Qianyu Chen Haonan Mai Jindi Guo Sixun Dong Xiaohua Xuan MLLM LLMAG 41 19 0 19 Jan 2024
The What, Why, and How of Context Length Extension Techniques in Large Language Models -- A Detailed Survey Saurav Pawar S.M. Towhidul Islam Tonmoy S. M. M. Zaman Vinija Jain Aman Chadha Amitava Das 24 24 0 15 Jan 2024
Integrating Physician Diagnostic Logic into Large Language Models: Preference Learning from Process Feedback Chengfeng Dou Zhi Jin Wenpin Jiao Haiyan Zhao Yongqiang Zhao Zhenwei Tao LM&MA 74 4 0 11 Jan 2024
TransportationGames: Benchmarking Transportation Knowledge of (Multimodal) Large Language Models Xue Zhang Xiangyu Shi Xinyue Lou Rui Qi Yufeng Chen Jinan Xu Wenjuan Han 32 4 0 09 Jan 2024
Know Your Needs Better: Towards Structured Understanding of Marketer Demands with Analogical Reasoning Augmented LLMs Junjie Wang Dan Yang Binbin Hu Yue Shen Wen Zhang Jinjie Gu LRM 27 0 0 09 Jan 2024
TeleChat Technical Report Zhongjiang He Zihan Wang Xinzhan Liu Shixuan Liu Yitong Yao ... Zilu Huang Sishi Xiong Yuxiang Zhang Chao Wang Shuangyong Song AI4MH LRM ALM 56 3 0 08 Jan 2024
MERBench: A Unified Evaluation Benchmark for Multimodal Emotion Recognition Zheng Lian Licai Sun Yong Ren Hao Gu Haiyang Sun Lan Chen Bin Liu Jianhua Tao 11 12 0 07 Jan 2024
Grimoire is All You Need for Enhancing Large Language Models Ding Chen Shichao Song Qingchen Yu Zhiyu Li Wenjin Wang Feiyu Xiong Bo Tang 25 4 0 07 Jan 2024
The Dawn After the Dark: An Empirical Study on Factuality Hallucination in Large Language Models Junyi Li Jie Chen Ruiyang Ren Xiaoxue Cheng Wayne Xin Zhao Jian-Yun Nie Ji-Rong Wen HILM 36 40 0 06 Jan 2024
Understanding LLMs: A Comprehensive Overview from Training to Inference Yi-Hsueh Liu Haoyang He Tianle Han Xu-Yao Zhang Mengyuan Liu ... Xintao Hu Tuo Zhang Ning Qiang Tianming Liu Bao Ge SyDa 14 64 0 04 Jan 2024
HSC-GPT: A Large Language Model for Human Settlements Construction Ran Chen Xueqi Yao Xuhui Jiang Zhengqi Han Jingze Guo ... Chumin Liu Jing Zhao Zeke Lian Jingjing Zhang Keke Li 21 1 0 31 Dec 2023
Uncertainty-Penalized Reinforcement Learning from Human Feedback with Diverse Reward LoRA Ensembles Yuanzhao Zhai Han Zhang Yu Lei Yue Yu Kele Xu Dawei Feng Bo Ding Huaimin Wang AI4CE 61 31 0 30 Dec 2023
Olapa-MCoT: Enhancing the Chinese Mathematical Reasoning Capability of LLMs Shaojie Zhu Zhaobin Wang Chengxiang Zhuo Hui Lu Bo Hu Zang Li LRM 27 0 0 29 Dec 2023
Adapting Large Language Models for Education: Foundational Capabilities, Potentials, and Challenges Qingyao Li Lingyue Fu Weiming Zhang Xianyu Chen Jingwei Yu Wei Xia Weinan Zhang Ruiming Tang Yong Yu AI4Ed ELM 27 17 0 27 Dec 2023
PanGu- $π$ : Enhancing Language Model Architectures via Nonlinearity Compensation Yunhe Wang Hanting Chen Yehui Tang Tianyu Guo Kai Han ... Qinghua Xu Qun Liu Jun Yao Chao Xu Dacheng Tao 59 15 0 27 Dec 2023
RoleEval: A Bilingual Role Evaluation Benchmark for Large Language Models Tianhao Shen Sun Li Quan Tu Deyi Xiong LLMAG ELM 14 8 0 26 Dec 2023
HyKGE: A Hypothesis Knowledge Graph Enhanced Framework for Accurate and Reliable Medical LLMs Responses Xinke Jiang Ruizhe Zhang Yongxin Xu Rihong Qiu Yue Fang ... Jinyi Tang Hongxin Ding Xu Chu Junfeng Zhao Yasha Wang RALM 17 19 0 26 Dec 2023
Alleviating Hallucinations of Large Language Models through Induced Hallucinations Yue Zhang Leyang Cui Wei Bi Shuming Shi HILM 34 49 0 25 Dec 2023