Title
Memory-Efficient Fine-Tuning of Compressed Large Language Models via sub-4-bit Integer Quantization Jeonghoon Kim J. H. Lee Sungdong Kim Joonsuk Park Kang Min Yoo S. Kwon Dongsoo Lee MQ 23 96 0 23 May 2023
Large Language Models as Commonsense Knowledge for Large-Scale Task Planning Zirui Zhao W. Lee David Hsu LRM LLMAG LM&Ro 20 89 0 23 May 2023
Knowledge of Knowledge: Exploring Known-Unknowns Uncertainty with Large Language Models Alfonso Amayuelas Kyle Wong Liangming Pan Wenhu Chen W. Wang 32 25 0 23 May 2023
LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models Long Lian Boyi Li Adam Yala Trevor Darrell 12 150 0 23 May 2023
APPLS: Evaluating Evaluation Metrics for Plain Language Summarization Yue Guo Tal August Gondy Leroy T. Cohen Lucy Lu Wang 43 7 0 23 May 2023
Adaptive Chameleon or Stubborn Sloth: Revealing the Behavior of Large Language Models in Knowledge Conflicts Jian Xie Kai Zhang Jiangjie Chen Renze Lou Yu-Chuan Su RALM 198 150 0 22 May 2023
Chain-of-Knowledge: Grounding Large Language Models via Dynamic Knowledge Adapting over Heterogeneous Sources Xingxuan Li Ruochen Zhao Yew Ken Chia Bosheng Ding Shafiq R. Joty Soujanya Poria Lidong Bing HILM BDL LRM 79 85 0 22 May 2023
Large Language Models are Not Yet Human-Level Evaluators for Abstractive Summarization Chenhui Shen Liying Cheng Xuan-Phi Nguyen Yang You Lidong Bing ELM ALM 14 63 0 22 May 2023
Iterative Forward Tuning Boosts In-Context Learning in Language Models Jiaxi Yang Binyuan Hui Min Yang Bailin Wang Bowen Li Binhua Li Fei Huang Yongbin Li 16 15 0 22 May 2023
GPT-SW3: An Autoregressive Language Model for the Nordic Languages Ariel Ekgren Amaru Cuba Gyllensten Felix Stollenwerk Joey Öhman T. Isbister Evangelia Gogoulou F. Carlsson Alice Heiman Judit Casademont Magnus Sahlgren 10 13 0 22 May 2023
Meta-in-context learning in large language models Julian Coda-Forno Marcel Binz Zeynep Akata M. Botvinick Jane X. Wang Eric Schulz LRM 181 34 0 22 May 2023
Investigating Agency of LLMs in Human-AI Collaboration Tasks Ashish Sharma Sudha Rao Chris Brockett Akanksha Malhotra Nebojsa Jojic W. Dolan LLMAG 19 10 0 22 May 2023
Word Embeddings Are Steers for Language Models Chi Han Jialiang Xu Manling Li Yi Ren Fung Chenkai Sun Nan Jiang Tarek F. Abdelzaher Heng Ji LLMSV 19 10 0 22 May 2023
A Frustratingly Simple Decoding Method for Neural Text Generation Haoran Yang Deng Cai Huayang Li Wei Bi Wai Lam Shuming Shi 36 11 0 22 May 2023
Gene Set Summarization using Large Language Models marcin p. joachimiak J. H. Caufield N. Harris Hyeongsik Kim Christopher J. Mungall 16 17 0 21 May 2023
OntoType: Ontology-Guided and Pre-Trained Language Model Assisted Fine-Grained Entity Typing Tanay Komarlu Minhao Jiang Xuan Wang Jiawei Han 13 0 0 21 May 2023
Contextualizing Argument Quality Assessment with Relevant Knowledge D. Deshpande Zhivar Sourati Filip Ilievski Fred Morstatter 17 1 0 20 May 2023
Clinical Camel: An Open Expert-Level Medical Language Model with Dialogue-Based Knowledge Encoding Augustin Toma Patrick R. Lawler Jimmy Ba Rahul G. Krishnan Barry Rubin Bo Wang LM&MA AI4MH ELM 12 29 0 19 May 2023
HaluEval: A Large-Scale Hallucination Evaluation Benchmark for Large Language Models Junyi Li Xiaoxue Cheng Wayne Xin Zhao J. Nie Ji-Rong Wen HILM VLM 12 228 0 19 May 2023
InstructIE: A Bilingual Instruction-based Information Extraction Dataset Honghao Gui Shuofei Qiao Jintian Zhang Hongbin Ye Mengshu Sun Lei Liang Jeff Z. Pan Huajun Chen Ningyu Zhang 21 6 0 19 May 2023
LLM-CXR: Instruction-Finetuned LLM for CXR Image Understanding and Generation Suhyeon Lee Won Jun Kim Jinho Chang Jong Chul Ye MedIm 24 46 0 19 May 2023
Federated Foundation Models: Privacy-Preserving and Collaborative Learning for Large Models Sixing Yu J. P. Muñoz Ali Jannesari AI4CE 11 45 0 19 May 2023
Explaining black box text modules in natural language with language models Chandan Singh Aliyah R. Hsu Richard Antonello Shailee Jain Alexander G. Huth Bin-Xia Yu Jianfeng Gao MILM 11 46 0 17 May 2023
Small Models are Valuable Plug-ins for Large Language Models Canwen Xu Yichong Xu Shuohang Wang Yang Liu Chenguang Zhu Julian McAuley LLMAG 29 42 0 15 May 2023
ONCE: Boosting Content-based Recommendation with Both Open- and Closed-source Large Language Models Qijiong Liu Nuo Chen Tetsuya Sakai Xiao-Ming Wu 21 50 0 11 May 2023
Multi-step Jailbreaking Privacy Attacks on ChatGPT Haoran Li Dadi Guo Wei Fan Mingshi Xu Jie Huang Fanpu Meng Yangqiu Song SILM 11 317 0 11 Apr 2023
Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis Wenhao Zhu Hongyi Liu Qingxiu Dong Jingjing Xu Shujian Huang Lingpeng Kong Jiajun Chen Lei Li LRM 18 139 0 10 Apr 2023
OpenAGI: When LLM Meets Domain Experts Yingqiang Ge Wenyue Hua Kai Mei Jianchao Ji Juntao Tan Shuyuan Xu Zelong Li Yongfeng Zhang VLM LRM 17 206 0 10 Apr 2023
Making AI Less "Thirsty": Uncovering and Addressing the Secret Water Footprint of AI Models Pengfei Li Jianyi Yang M. A. Islam Shaolei Ren 70 104 0 06 Apr 2023
Error Analysis Prompting Enables Human-Like Translation Evaluation in Large Language Models Qingyu Lu Baopu Qiu Liang Ding Liping Xie Tom Kocmi Dacheng Tao LRM ALM ELM 13 102 0 24 Mar 2023
VideoXum: Cross-modal Visual and Textural Summarization of Videos Jingyang Lin Hang Hua Ming Chen Yikang Li Jenhao Hsiao C. Ho Jiebo Luo 15 30 0 21 Mar 2023
Prophet: Prompting Large Language Models with Complementary Answer Heuristics for Knowledge-based Visual Question Answering Zhou Yu Xuecheng Ouyang Zhenwei Shao Mei Wang Jun Yu MLLM 86 11 0 03 Mar 2023
CodeLMSec Benchmark: Systematically Evaluating and Finding Security Vulnerabilities in Black-Box Code Language Models Hossein Hajipour Keno Hassler Thorsten Holz Lea Schonherr Mario Fritz ELM 17 19 0 08 Feb 2023
Describe, Explain, Plan and Select: Interactive Planning with Large Language Models Enables Open-World Multi-Task Agents Zihao Wang Shaofei Cai Guanzhou Chen Anji Liu Xiaojian Ma Yitao Liang LM&Ro LLMAG 30 313 0 03 Feb 2023
The geometry of hidden representations of large transformer models L. Valeriani Diego Doimo F. Cuturello A. Laio A. Ansuini Alberto Cazzaniga MILM 14 48 0 01 Feb 2023
The Touché23-ValueEval Dataset for Identifying Human Values behind Arguments Nailia Mirzakhmedova Johannes Kiesel Milad Alshomary Maximilian Heinrich Nicolas Handke ... Mohammad Ali Sadraei Ehsaneddin Asgari Lea Kawaletz Henning Wachsmuth Benno Stein 17 38 0 31 Jan 2023
Large Language Models for Biomedical Knowledge Graph Construction: Information extraction from EMR notes Vahan Arsenyan Spartak Bughdaryan Fadi Shaya Kent Small Davit Shahnazaryan 17 10 0 29 Jan 2023
BDMMT: Backdoor Sample Detection for Language Models through Model Mutation Testing Jiali Wei Ming Fan Wenjing Jiao Wuxia Jin Ting Liu AAML 11 10 0 25 Jan 2023
Tensor Networks Meet Neural Networks: A Survey and Future Perspectives Maolin Wang Y. Pan Zenglin Xu Xiangli Yang Guangxi Li A. Cichocki Andrzej Cichocki 38 19 0 22 Jan 2023
Commentary Generation from Data Records of Multiplayer Strategy Esports Game Zihan Wang Naoki Yoshinaga 11 0 0 21 Dec 2022
Language Generation Models Can Cause Harm: So What Can We Do About It? An Actionable Survey Sachin Kumar Vidhisha Balachandran Lucille Njoo Antonios Anastasopoulos Yulia Tsvetkov ELM 58 59 0 14 Oct 2022
The Open-World Lottery Ticket Hypothesis for OOD Intent Classification Yunhua Zhou Pengyu Wang Peiju Liu Yuxin Wang Xipeng Qiu 16 2 0 13 Oct 2022
Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned Deep Ganguli Liane Lovitt John Kernion Amanda Askell Yuntao Bai ... Nicholas Joseph Sam McCandlish C. Olah Jared Kaplan Jack Clark 216 327 0 23 Aug 2022
Topic-Controllable Summarization: Topic-Aware Evaluation and Transformer Methods Tatiana Passali Grigorios Tsoumakas 14 0 0 09 Jun 2022
"I'm sorry to hear that": Finding New Biases in Language Models with a Holistic Descriptor Dataset Eric Michael Smith Melissa Hall Melanie Kambadur Eleonora Presani Adina Williams 62 128 0 18 May 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
DeepNet: Scaling Transformers to 1,000 Layers Hongyu Wang Shuming Ma Li Dong Shaohan Huang Dongdong Zhang Furu Wei MoE AI4CE 15 155 0 01 Mar 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022
$Understanding Dataset Difficulty with $\mathcal{V}$-Usable Information$ Understanding Dataset Difficulty with $\mathcal{V}$ -Usable Information Kawin Ethayarajh Yejin Choi Swabha Swayamdipta 154 157 0 16 Oct 2021
Deduplicating Training Data Makes Language Models Better Katherine Lee Daphne Ippolito A. Nystrom Chiyuan Zhang Douglas Eck Chris Callison-Burch Nicholas Carlini SyDa 234 447 0 14 Jul 2021