Title
DistillSpec: Improving Speculative Decoding via Knowledge Distillation Yongchao Zhou Kaifeng Lyu A. S. Rawat A. Menon Afshin Rostamizadeh Sanjiv Kumar Jean-François Kagy Rishabh Agarwal 34 77 0 12 Oct 2023
Prompting Large Language Models with Chain-of-Thought for Few-Shot Knowledge Base Question Generation Yuanyuan Liang Jianing Wang Hanlun Zhu Lei Wang Weining Qian Yunshi Lan LRM ReLM 11 36 0 12 Oct 2023
Found in the Middle: Permutation Self-Consistency Improves Listwise Ranking in Large Language Models Raphael Tang Xinyu Crystina Zhang Xueguang Ma Jimmy Lin Ferhan Ture LRM 29 15 0 11 Oct 2023
KwaiYiiMath: Technical Report Jia-Yi Fu Lei Lin Xiaoyang Gao Pengli Liu Zhengzong Chen ... Zijia Lin Fuzheng Zhang Zhongyuan Wang Di Zhang Kun Gai LRM ReLM RALM 38 2 0 11 Oct 2023
Don't Fine-Tune, Decode: Syntax Error-Free Tool Use via Constrained Decoding Kexun Zhang Hongqiao Chen Lei Li W. Wang 32 4 0 10 Oct 2023
Lemur: Harmonizing Natural Language and Code for Language Agents Yiheng Xu Hongjin Su Chen Xing Boyu Mi Qian Liu ... Siheng Zhao Lingpeng Kong Bailin Wang Caiming Xiong Tao Yu 21 67 0 10 Oct 2023
Mistral 7B Albert Q. Jiang Alexandre Sablayrolles A. Mensch Chris Bamford Devendra Singh Chaplot ... Teven Le Scao Thibaut Lavril Thomas Wang Timothée Lacroix William El Sayed MoE LRM 23 955 0 10 Oct 2023
TRACE: A Comprehensive Benchmark for Continual Learning in Large Language Models Xiao Wang Yuan Zhang Tianze Chen Songyang Gao Senjie Jin ... Rui Zheng Yicheng Zou Tao Gui Qi Zhang Xuanjing Huang ALM LRM CLL 33 18 0 10 Oct 2023
Generalizable Chain-of-Thought Prompting in Mixed-task Scenarios with Large Language Models Anni Zou Zhuosheng Zhang Hai Zhao Xiangru Tang LRM ReLM 34 1 0 10 Oct 2023
SALMON: Self-Alignment with Instructable Reward Models Zhiqing Sun Yikang Shen Hongxin Zhang Qinhong Zhou Zhenfang Chen David D. Cox Yiming Yang Chuang Gan ALM SyDa 11 35 0 09 Oct 2023
LLMLingua: Compressing Prompts for Accelerated Inference of Large Language Models Huiqiang Jiang Qianhui Wu Chin-Yew Lin Yuqing Yang Lili Qiu 8 99 0 09 Oct 2023
Guiding Language Model Math Reasoning with Planning Tokens Xinyi Wang Lucas Page-Caccia O. Ostapenko Xingdi Yuan William Yang Wang Alessandro Sordoni LRM 29 2 0 09 Oct 2023
Compresso: Structured Pruning with Collaborative Prompting Learns Compact Large Language Models Song Guo Jiahang Xu Li Lyna Zhang Mao Yang 17 14 0 08 Oct 2023
Self-Knowledge Guided Retrieval Augmentation for Large Language Models Yile Wang Peng Li Maosong Sun Yang Liu RALM KELM 21 42 0 08 Oct 2023
Towards Better Chain-of-Thought Prompting Strategies: A Survey Zihan Yu Liang He Zhen Wu Xinyu Dai Jiajun Chen LRM 115 40 0 08 Oct 2023
Resprompt: Residual Connection Prompting Advances Multi-Step Reasoning in Large Language Models Song Jiang Zahra Shakeri Aaron Chan Maziar Sanjabi Hamed Firooz ... Bugra Akyildiz Yizhou Sun Jinchao Li Qifan Wang Asli Celikyilmaz LRM ReLM 15 3 0 07 Oct 2023
Adapting Large Language Models for Content Moderation: Pitfalls in Data Engineering and Supervised Fine-tuning Huan Ma Changqing Zhang Huazhu Fu Peilin Zhao Bing Wu OffRL AI4MH 24 11 0 05 Oct 2023
JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning Chang Gao Wenxuan Zhang Guizhen Chen Wai Lam 47 5 0 04 Oct 2023
Shadow Alignment: The Ease of Subverting Safely-Aligned Language Models Xianjun Yang Xiao Wang Qi Zhang Linda R. Petzold William Yang Wang Xun Zhao Dahua Lin 18 159 0 04 Oct 2023
Think before you speak: Training Language Models With Pause Tokens Sachin Goyal Ziwei Ji A. S. Rawat A. Menon Sanjiv Kumar Vaishnavh Nagarajan LRM 15 92 0 03 Oct 2023
Instances Need More Care: Rewriting Prompts for Instances with LLMs in the Loop Yields Better Zero-Shot Performance Saurabh Srivastava Chengyue Huang Weiguo Fan Ziyu Yao LLMAG 20 3 0 03 Oct 2023
Large Language Models as Analogical Reasoners Michihiro Yasunaga Xinyun Chen Yujia Li Panupong Pasupat J. Leskovec Percy Liang Ed H. Chi Denny Zhou ReLM LRM 13 73 0 03 Oct 2023
Probing the Multi-turn Planning Capabilities of LLMs via 20 Question Games Yizhe Zhang Jiarui Lu Navdeep Jaitly LRM ELM 8 9 0 02 Oct 2023
UPAR: A Kantian-Inspired Prompting Framework for Enhancing Large Language Model Capabilities Hejia Geng Boxun Xu Peng Li ELM LRM ReLM 27 1 0 30 Sep 2023
Corex: Pushing the Boundaries of Complex Reasoning through Multi-Model Collaboration Qiushi Sun Zhangyue Yin Xiang Li Zhiyong Wu Xipeng Qiu Lingpeng Kong LRM LLMAG 15 43 0 30 Sep 2023
"I'd Like to Have an Argument, Please": Argumentative Reasoning in Large Language Models Sizhe Wei Yifan Lu LRM 24 4 0 29 Sep 2023
Qwen Technical Report Jinze Bai Shuai Bai Yunfei Chu Zeyu Cui Kai Dang ... Zhenru Zhang Chang Zhou Jingren Zhou Xiaohuan Zhou Tianhang Zhu OSLM 29 1,559 0 28 Sep 2023
GPT-Fathom: Benchmarking Large Language Models to Decipher the Evolutionary Path towards GPT-4 and Beyond Timothée Darcet Yuyu Zhang Yijie Zhu Chenguang Xi Pengyang Gao Piotr Bojanowski Kevin Chen-Chuan Chang ELM 19 22 0 28 Sep 2023
A Benchmark for Learning to Translate a New Language from One Grammar Book Garrett Tanzer Mirac Suzgun Chenguang Xi Dan Jurafsky Luke Melas-Kyriazi 16 51 0 28 Sep 2023
Language Models as a Service: Overview of a New Paradigm and its Challenges Emanuele La Malfa Aleksandar Petrov Simon Frieder Christoph Weinhuber Ryan Burnell Raza Nazar Anthony Cohn Nigel Shadbolt Michael Wooldridge ALM ELM 24 3 0 28 Sep 2023
LawBench: Benchmarking Legal Knowledge of Large Language Models Zhiwei Fei Xiaoyu Shen D. Zhu Fengzhe Zhou Zhuo Han Songyang Zhang Kai-xiang Chen Zongwen Shen Jidong Ge ELM AILaw 19 32 0 28 Sep 2023
ModuLoRA: Finetuning 2-Bit LLMs on Consumer GPUs by Integrating with Modular Quantizers Junjie Yin Jiahao Dong Yingheng Wang Christopher De Sa Volodymyr Kuleshov MQ 21 4 0 28 Sep 2023
NLPBench: Evaluating Large Language Models on Solving NLP Problems Linxin Song Jieyu Zhang Lechao Cheng Pengyuan Zhou Tianyi Zhou Irene Z Li ELM LM&MA LRM 23 10 0 27 Sep 2023
Navigate through Enigmatic Labyrinth A Survey of Chain of Thought Reasoning: Advances, Frontiers and Future Zheng Chu Jingchang Chen Qianglong Chen Weijiang Yu Tao He Haotian Wang Weihua Peng Ming-Yu Liu Bing Qin Ting Liu LRM AI4CE 16 148 0 27 Sep 2023
HANS, are you clever? Clever Hans Effect Analysis of Neural Systems Leonardo Ranaldi Fabio Massimo Zanzotto 15 1 0 21 Sep 2023
Natural Language Embedded Programs for Hybrid Language Symbolic Reasoning Tianhua Zhang Jiaxin Ge Hongyin Luo Yung-Sung Chuang Mingye Gao Yuan Gong Xixin Wu Yoon Kim Helen M. Meng James R. Glass LRM ReLM 79 15 0 19 Sep 2023
OpenBA: An Open-sourced 15B Bilingual Asymmetric seq2seq Model Pre-trained from Scratch Juntao Li Zecheng Tang Yuyang Ding Pinzheng Wang Pei Guo ... Wenliang Chen Guohong Fu Qiaoming Zhu Guodong Zhou M. Zhang 40 4 0 19 Sep 2023
Baichuan 2: Open Large-scale Language Models Ai Ming Yang Bin Xiao Bingning Wang Borong Zhang Ce Bian ... Youxin Jiang Yuchen Gao Yupeng Zhang Zenan Zhou Zhiying Wu ELM LRM 31 678 0 19 Sep 2023
Safety-Tuned LLaMAs: Lessons From Improving the Safety of Large Language Models that Follow Instructions Federico Bianchi Mirac Suzgun Giuseppe Attanasio Paul Röttger Dan Jurafsky Tatsunori Hashimoto James Y. Zou ALM LM&MA LRM 10 175 0 14 Sep 2023
Re-Reading Improves Reasoning in Large Language Models Xiaohan Xu Chongyang Tao Tao Shen Can Xu Hongbo Xu Guodong Long Jian-Guang Lou ReLM LRM KELM 13 22 0 12 Sep 2023
MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning Xiang Yue Xingwei Qu Ge Zhang Yao Fu Wenhao Huang Huan Sun Yu-Chuan Su Wenhu Chen AIMat LRM 54 361 0 11 Sep 2023
Large Language Models as Optimizers Chengrun Yang Xuezhi Wang Yifeng Lu Hanxiao Liu Quoc V. Le Denny Zhou Xinyun Chen ODL 19 369 0 07 Sep 2023
HAE-RAE Bench: Evaluation of Korean Knowledge in Language Models Guijin Son Hanwool Albert Lee Suwan Kim Huiseo Kim Jaecheol Lee Je Won Yeom Jihyu Jung Jung Woo Kim Songseong Kim RALM ELM 18 20 0 06 Sep 2023
When Do Program-of-Thoughts Work for Reasoning? Zhen Bi Ningyu Zhang Yinuo Jiang Shumin Deng Guozhou Zheng Huajun Chen LRM 12 20 0 29 Aug 2023
Empowering Cross-lingual Abilities of Instruction-tuned Large Language Models by Translation-following demonstrations Leonardo Ranaldi Giulia Pucci André Freitas 19 33 0 27 Aug 2023
Diffusion Language Models Can Perform Many Tasks with Scaling and Instruction-Finetuning Jiasheng Ye Zaixiang Zheng Yu Bao Lihua Qian Quanquan Gu DiffM 46 14 0 23 Aug 2023
Instruction Tuning for Large Language Models: A Survey Shengyu Zhang Linfeng Dong Xiaoya Li Sen Zhang Xiaofei Sun ... Jiwei Li Runyi Hu Tianwei Zhang Fei Wu Guoyin Wang LM&MA 16 524 0 21 Aug 2023
Algorithm of Thoughts: Enhancing Exploration of Ideas in Large Language Models Bilgehan Sel Ahmad S. Al-Tawaha Vanshaj Khattar R. Jia Ming Jin LM&Ro LRM 13 62 0 20 Aug 2023
PACE: Improving Prompt with Actor-Critic Editing for Large Language Model Yihong Dong Kangcheng Luo Xue Jiang Zhi Jin Ge Li LRM KELM 8 9 0 19 Aug 2023
Red-Teaming Large Language Models using Chain of Utterances for Safety-Alignment Rishabh Bhardwaj Soujanya Poria ELM 17 125 0 18 Aug 2023