Title
Stronger Random Baselines for In-Context Learning Gregory Yauney David M. Mimno 45 2 0 19 Apr 2024
Relevant or Random: Can LLMs Truly Perform Analogical Reasoning? Chengwei Qin Wenhan Xia Tan Wang Fangkai Jiao Yuchen Hu Bosheng Ding Ruirui Chen Shafiq R. Joty LRM 35 3 0 19 Apr 2024
Large Language Models in Targeted Sentiment Analysis Nicolay Rusnachenko A. Golubev Natalia V. Loukachevitch LRM 22 3 0 18 Apr 2024
Missed Connections: Lateral Thinking Puzzles for Large Language Models Graham Todd Timothy Merino Sam Earle Julian Togelius ReLM LRM 27 7 0 17 Apr 2024
ViLLM-Eval: A Comprehensive Evaluation Suite for Vietnamese Large Language Models Trong-Hieu Nguyen Anh-Cuong Le Viet-Cuong Nguyen 25 0 0 17 Apr 2024
Many-Shot In-Context Learning Rishabh Agarwal Avi Singh Lei M. Zhang Bernd Bohnet Luis Rosias ... John D. Co-Reyes Eric Chu Feryal M. P. Behbahani Aleksandra Faust Hugo Larochelle ReLM OffRL BDL 50 96 0 17 Apr 2024
Self-playing Adversarial Language Game Enhances LLM Reasoning Pengyu Cheng Tianhao Hu Han Xu Zhisong Zhang Yong Dai Lei Han Nan Du Nan Du Xiaolong Li SyDa LRM ReLM 87 28 0 16 Apr 2024
HLAT: High-quality Large Language Model Pre-trained on AWS Trainium Haozheng Fan Hao Zhou Guangtai Huang Parameswaran Raman Xinwei Fu Gaurav Gupta Dhananjay Ram Yida Wang Jun Huan 36 5 0 16 Apr 2024
When Emotional Stimuli meet Prompt Designing: An Auto-Prompt Graphical Paradigm Chenggian Ma Xiangyu Zhao Chunhui Zhang Yanzhao Qin Wentao Zhang LLMAG 27 0 0 16 Apr 2024
Learn Your Reference Model for Real Good Alignment Alexey Gorbatovski Boris Shaposhnikov Alexey Malakhov Nikita Surnachev Yaroslav Aksenov Ian Maksimov Nikita Balagansky Daniil Gavrilov OffRL 47 25 0 15 Apr 2024
Intuition-aware Mixture-of-Rank-1-Experts for Parameter Efficient Finetuning Yijiang Liu Rongyu Zhang Huanrui Yang Kurt Keutzer Yuan Du Li Du Shanghang Zhang MoE 36 6 0 13 Apr 2024
Experimental Design for Active Transductive Inference in Large Language Models Subhojyoti Mukherjee Anusha Lalitha Aniket Deshmukh Ge Liu Yifei Ma B. Kveton LRM 35 1 0 12 Apr 2024
Rho-1: Not All Tokens Are What You Need Zheng-Wen Lin Zhibin Gou Yeyun Gong Xiao Liu Yelong Shen ... Chen Lin Yujiu Yang Jian Jiao Nan Duan Weizhu Chen CLL 46 55 0 11 Apr 2024
UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs Chaoqun He Renjie Luo Shengding Hu Yuanqian Zhao Jie Zhou Hanghao Wu Jiajie Zhang Xu Han Zhiyuan Liu Maosong Sun ELM 31 13 0 11 Apr 2024
Ada-LEval: Evaluating long-context LLMs with length-adaptable benchmarks Chonghua Wang Haodong Duan Songyang Zhang Dahua Lin Kai-xiang Chen ELM 26 16 0 09 Apr 2024
CodecLM: Aligning Language Models with Tailored Synthetic Data Zifeng Wang Chun-Liang Li Vincent Perot Long T. Le Jin Miao Zizhao Zhang Chen-Yu Lee Tomas Pfister SyDa ALM 16 17 0 08 Apr 2024
RoT: Enhancing Large Language Models with Reflection on Search Trees Wenyang Hui Kewei Tu LRM 27 6 0 08 Apr 2024
Can only LLMs do Reasoning?: Potential of Small Language Models in Task Planning Gawon Choi Hyemin Ahn LM&Ro LRM 24 1 0 05 Apr 2024
Verifiable by Design: Aligning Language Models to Quote from Pre-Training Data Jingyu Zhang Marc Marone Tianjian Li Benjamin Van Durme Daniel Khashabi 85 9 0 05 Apr 2024
ChatGLM-Math: Improving Math Problem-Solving in Large Language Models with a Self-Critique Pipeline Yifan Xu Xiao Liu Xinghan Liu Zhenyu Hou Yueyan Li ... Aohan Zeng Zhengxiao Du Wenyi Zhao Jie Tang Yuxiao Dong LRM 36 33 0 03 Apr 2024
Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models Hyungjoo Chae Yeonghyeon Kim Seungone Kim Kai Tzu-iunn Ong Beong-woo Kwak ... Seonghwan Kim Taeyoon Kwon Jiwan Chung Youngjae Yu Jinyoung Yeo LRM ReLM 24 13 0 03 Apr 2024
LLMs in the Loop: Leveraging Large Language Model Annotations for Active Learning in Low-Resource Languages Nataliia Kholodna Sahib Julka Mohammad Khodadadi Muhammed Nurullah Gumus Michael Granitzer 27 9 0 02 Apr 2024
Advancing LLM Reasoning Generalists with Preference Trees Lifan Yuan Ganqu Cui Hanbin Wang Ning Ding Xingyao Wang ... Zhenghao Liu Bowen Zhou Hao Peng Zhiyuan Liu Maosong Sun LRM 27 94 0 02 Apr 2024
Transformers as Transducers Lena Strobl Dana Angluin David Chiang Jonathan Rawski Ashish Sabharwal 16 4 0 02 Apr 2024
HyperCLOVA X Technical Report Kang Min Yoo Jaegeun Han Sookyo In Heewon Jeon Jisu Jeong ... Hyunkyung Noh Se-Eun Choi Sang-Woo Lee Jung Hwa Lim Nako Sung VLM 27 8 0 02 Apr 2024
Efficient Prompting Methods for Large Language Models: A Survey Kaiyan Chang Songcheng Xu Chenglong Wang Yingfeng Luo Tong Xiao Jingbo Zhu LRM 30 32 0 01 Apr 2024
A Theory for Length Generalization in Learning to Reason Changnan Xiao Bing Liu LRM 29 8 0 31 Mar 2024
Measuring Taiwanese Mandarin Language Understanding Po-Heng Chen Sijia Cheng Wei-Lin Chen Yen-Ting Lin Yun-Nung Chen ELM 39 2 0 29 Mar 2024
Constructing Multilingual Visual-Text Datasets Revealing Visual Multilingual Ability of Vision Language Models Jesse Atuhurra Iqra Ali Tatsuya Hiraoka Hidetaka Kamigaito Tomoya Iwakura Taro Watanabe 38 1 0 29 Mar 2024
Jamba: A Hybrid Transformer-Mamba Language Model Opher Lieber Barak Lenz Hofit Bata Gal Cohen Jhonathan Osin ... Nir Ratner N. Rozen Erez Shwartz Mor Zusman Y. Shoham 21 206 0 28 Mar 2024
COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning Yuelin Bai Xinrun Du Yiming Liang Yonggang Jin Ziqiang Liu ... Chenghua Lin Jie Fu Min Yang Shiwen Ni Ge Zhang ALM 35 32 0 26 Mar 2024
PCToolkit: A Unified Plug-and-Play Prompt Compression Toolkit of Large Language Models Jinyi Li Yihuai Lan Lei Wang Hao Wang 25 0 0 26 Mar 2024
KnowLA: Enhancing Parameter-efficient Finetuning with Knowledgeable Adaptation Xindi Luo Zequn Sun Jing-xin Zhao Zhe Zhao Wei Hu KELM 19 3 0 22 Mar 2024
Benchmarking Chinese Commonsense Reasoning of LLMs: From Chinese-Specifics to Reasoning-Memorization Correlations Jiaxing Sun Weiquan Huang Jiang Wu Chenya Gu Wei Li Songyang Zhang Hang Yan Conghui He LRM 28 5 0 21 Mar 2024
AgentGroupChat: An Interactive Group Chat Simulacra For Better Eliciting Emergent Behavior Zhouhong Gu Xiaoxuan Zhu Haoran Guo Lin Zhang Yin Cai ... Yifei Dai Yan Gao Yao Hu Hongwei Feng Yanghua Xiao AI4CE 32 1 0 20 Mar 2024
Pragmatic Competence Evaluation of Large Language Models for Korean Dojun Park Jiwoo Lee Hyeyun Jeong Seohyun Park Sungeun Lee ELM 36 2 0 19 Mar 2024
RankPrompt: Step-by-Step Comparisons Make Language Models Better Reasoners Chi Hu Yuan Ge Xiangnan Ma Hang Cao Qiang Li Yonghua Yang Tong Xiao Jingbo Zhu ReLM ELM LRM ALM 37 9 0 19 Mar 2024
HateCOT: An Explanation-Enhanced Dataset for Generalizable Offensive Speech Detection via Large Language Models H. Nghiem Hal Daumé 31 1 0 18 Mar 2024
BEnQA: A Question Answering and Reasoning Benchmark for Bengali and English H. M. Q. H. Sheikh Shafayat Rishav Hada Isaac Cowhey Rifki Afina Jerry Tworek Lorie De Leon 26 3 0 16 Mar 2024
Meaningful Learning: Advancing Abstract Reasoning in Large Language Models via Generic Fact Guidance Kai Xiong Xiao Ding Ting Liu Bing Qin Dongliang Xu Qing Yang Hongtao Liu Yixin Cao LRM 29 3 0 14 Mar 2024
SMART: Submodular Data Mixture Strategy for Instruction Tuning Kowndinya Renduchintala S. Bhatia Ganesh Ramakrishnan 36 3 0 13 Mar 2024
Harder Tasks Need More Experts: Dynamic Routing in MoE Models Quzhe Huang Zhenwei An Zhuang Nan Mingxu Tao Chen Zhang ... Kun Xu Kun Xu Liwei Chen Songfang Huang Yansong Feng MoE 37 25 0 12 Mar 2024
Academically intelligent LLMs are not necessarily socially intelligent Ruoxi Xu Hongyu Lin Xianpei Han Le Sun Yingfei Sun ELM 18 6 0 11 Mar 2024
GEAR: An Efficient KV Cache Compression Recipe for Near-Lossless Generative Inference of LLM Hao Kang Qingru Zhang Souvik Kundu Geonhwa Jeong Zaoxing Liu Tushar Krishna Tuo Zhao MQ 30 77 0 08 Mar 2024
Bias-Augmented Consistency Training Reduces Biased Reasoning in Chain-of-Thought James Chua Edward Rees Hunar Batra Samuel R. Bowman Julian Michael Ethan Perez Miles Turpin LRM 39 13 0 08 Mar 2024
Will GPT-4 Run DOOM? Adrian de Wynter LM&Ro MLLM 30 5 0 08 Mar 2024
ERBench: An Entity-Relationship based Automatically Verifiable Hallucination Benchmark for Large Language Models Jio Oh Soyeon Kim Junseok Seo Jindong Wang Ruochen Xu Xing Xie Steven Euijong Whang 36 1 0 08 Mar 2024
LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error Boshi Wang Hao Fang Jason Eisner Benjamin Van Durme Yu-Chuan Su CLL 27 7 0 07 Mar 2024
Chain of Thought Explanation for Dialogue State Tracking Lin Xu Ningxin Peng Daquan Zhou See-Kiong Ng Jinlan Fu LRM 14 1 0 07 Mar 2024
Yi: Open Foundation Models by 01.AI 01. AI Alex Young 01.AI Alex Young Bei Chen Chao Li ... Yue Wang Yuxuan Cai Zhenyu Gu Zhiyuan Liu Zonghong Dai OSLM LRM 121 495 0 07 Mar 2024