Title
Key ingredients for effective zero-shot cross-lingual knowledge transfer in generative tasks Nadezhda Chirkova Vassilina Nikoulina 23 7 0 19 Feb 2024
High-quality Data-to-Text Generation for Severely Under-Resourced Languages with Out-of-the-box Large Language Models Michela Lorandi Anya Belz 6 5 0 19 Feb 2024
Enhancing Multilingual Capabilities of Large Language Models through Self-Distillation from Resource-Rich Languages Yuan Zhang Yile Wang Zijun Liu Shuo Wang Xiaolong Wang Peng Li Maosong Sun Yang Janet Liu LRM 27 10 0 19 Feb 2024
Amplifying Training Data Exposure through Fine-Tuning with Pseudo-Labeled Memberships Myung Gyo Oh Hong Eun Ahn L. Park T.-H. Kwon MIALM AAML 29 0 0 19 Feb 2024
Defending Against Weight-Poisoning Backdoor Attacks for Parameter-Efficient Fine-Tuning Shuai Zhao Leilei Gan Anh Tuan Luu Jie Fu Lingjuan Lyu Meihuizi Jia Jinming Wen AAML 26 22 0 19 Feb 2024
Your Large Language Model is Secretly a Fairness Proponent and You Should Prompt it Like One Tianlin Li Xiaoyu Zhang Chao Du Tianyu Pang Qian Liu Qing-Wu Guo Chao Shen Yang Liu ALM 39 10 0 19 Feb 2024
Purifying Large Language Models by Ensembling a Small Language Model Tianlin Li Qian Liu Tianyu Pang Chao Du Qing-Wu Guo Yang Liu Min-Bin Lin 48 16 0 19 Feb 2024
Do Large Language Models Understand Logic or Just Mimick Context? Junbing Yan Chengyu Wang Junyuan Huang Wei Zhang ReLM ELM LRM 21 5 0 19 Feb 2024
Small Models, Big Insights: Leveraging Slim Proxy Models To Decide When and What to Retrieve for LLMs Jiejun Tan Zhicheng Dou Yutao Zhu Peidong Guo Kun Fang Ji-Rong Wen 42 23 0 19 Feb 2024
Evaluating Program Repair with Semantic-Preserving Transformations: A Naturalness Assessment Thanh Le-Cong Dat Nguyen Bach Le Toby Murray 26 1 0 19 Feb 2024
KMMLU: Measuring Massive Multitask Language Understanding in Korean Guijin Son Hanwool Albert Lee Sungdong Kim Seungone Kim Niklas Muennighoff Taekyoon Choi Cheonbok Park Kang Min Yoo Stella Biderman ALM RALM ELM 47 37 0 18 Feb 2024
Proving membership in LLM pretraining data via data watermarks Johnny Tian-Zheng Wei Ryan Yixiang Wang Robin Jia WaLM 24 22 0 16 Feb 2024
EdgeQAT: Entropy and Distribution Guided Quantization-Aware Training for the Acceleration of Lightweight LLMs on the Edge Xuan Shen Zhenglun Kong Changdi Yang Zhaoyang Han Lei Lu ... Zhihao Shu Wei Niu Miriam Leeser Pu Zhao Yanzhi Wang MQ 51 18 0 16 Feb 2024
Do Llamas Work in English? On the Latent Language of Multilingual Transformers Chris Wendler V. Veselovsky Giovanni Monea Robert West 56 95 0 16 Feb 2024
LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty Zhen Zhang Yuhua Zhao Hang Gao Mengting Hu 35 20 0 16 Feb 2024
Comparing Hallucination Detection Metrics for Multilingual Generation Haoqiang Kang Terra Blevins Luke Zettlemoyer HILM 32 16 0 16 Feb 2024
Where is the answer? Investigating Positional Bias in Language Model Knowledge Extraction Kuniaki Saito Kihyuk Sohn Chen-Yu Lee Yoshitaka Ushiku 62 2 0 16 Feb 2024
BioMistral: A Collection of Open-Source Pretrained Large Language Models for Medical Domains Yanis Labrak Adrien Bazoge Emmanuel Morin P. Gourraud Mickael Rouvier Richard Dufour 102 190 0 15 Feb 2024
NutePrune: Efficient Progressive Pruning with Numerous Teachers for Large Language Models Shengrui Li Junzhe Chen Xueting Han Jing Bai 22 6 0 15 Feb 2024
Model Compression and Efficient Inference for Large Language Models: A Survey Wenxiao Wang Wei Chen Yicong Luo Yongliu Long Zhengkai Lin Liye Zhang Binbin Lin Deng Cai Xiaofei He MQ 41 47 0 15 Feb 2024
LogicPrpBank: A Corpus for Logical Implication and Equivalence Zhexiong Liu Jing Zhang Jiaying Lu Wenjing Ma Joyce C. Ho ReLM LRM 42 0 0 14 Feb 2024
Get More with LESS: Synthesizing Recurrence with KV Cache Compression for Efficient LLM Inference Harry Dong Xinyu Yang Zhenyu (Allen) Zhang Zhangyang Wang Yuejie Chi Beidi Chen 27 49 0 14 Feb 2024
Copyright Traps for Large Language Models Matthieu Meeus Igor Shilov Manuel Faysse Yves-Alexandre de Montjoye 36 18 0 14 Feb 2024
Towards Next-Level Post-Training Quantization of Hyper-Scale Transformers Junhan Kim Kyungphil Park Chungman Lee Ho-Young Kim Joonyoung Kim Yongkweon Jeon MQ 15 2 0 14 Feb 2024
BASE TTS: Lessons from building a billion-parameter Text-to-Speech model on 100K hours of data Mateusz Lajszczak Guillermo Cámbara Yang Li Fatih Beyhan Arent van Korlaar ... Bartosz Putrycz Soledad López Gambino Kayeon Yoo Elena Sokolova Thomas Drugman LM&MA 33 72 0 12 Feb 2024
Walia-LLM: Enhancing Amharic-LLaMA by Integrating Task-Specific and Generative Datasets Israel Abebe Azime A. Tonja Tadesse Destaw Belay Mitiku Yohannes Fuge A. Wassie Eyasu Shiferaw Jada Yonas Chanie W. Sewunetie Seid Muhie Yimam 24 1 0 12 Feb 2024
Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model A. Ustun Viraat Aryabumi Zheng-Xin Yong Wei-Yin Ko Daniel D'souza ... Shayne Longpre Niklas Muennighoff Marzieh Fadaee Julia Kreutzer Sara Hooker ALM ELM SyDa LRM 32 193 0 12 Feb 2024
Low-Resource Counterspeech Generation for Indic Languages: The Case of Bengali and Hindi Mithun Das Saurabh Kumar Pandey Shivansh Sethi Punyajoy Saha Animesh Mukherjee 28 2 0 11 Feb 2024
OpenFedLLM: Training Large Language Models on Decentralized Private Data via Federated Learning Rui Ye Wenhao Wang Jingyi Chai Dihan Li Zexi Li Yinda Xu Yaxin Du Yanfeng Wang Siheng Chen ALM FedML AIFin 11 76 0 10 Feb 2024
Aya Dataset: An Open-Access Collection for Multilingual Instruction Tuning Shivalika Singh Freddie Vargus Daniel D'souza Börje F. Karlsson Abinaya Mahendiran ... Max Bartolo Julia Kreutzer A. Ustun Marzieh Fadaee Sara Hooker 119 115 0 09 Feb 2024
Language Model Sentence Completion with a Parser-Driven Rhetorical Control Method Joshua Zingale Jugal Kalita 13 0 0 09 Feb 2024
ViGoR: Improving Visual Grounding of Large Vision Language Models with Fine-Grained Reward Modeling Siming Yan Min Bai Weifeng Chen Xiong Zhou Qixing Huang Erran L. Li VLM 23 18 0 09 Feb 2024
Large Language Models: A Survey Shervin Minaee Tomáš Mikolov Narjes Nikzad M. Asgari-Chenaghlu R. Socher Xavier Amatriain Jianfeng Gao ALM LM&MA ELM 122 364 0 09 Feb 2024
Real-World Robot Applications of Foundation Models: A Review Kento Kawaharazuka T. Matsushima Andrew Gambardella Jiaxian Guo Chris Paxton Andy Zeng OffRL VLM LM&Ro 46 45 0 08 Feb 2024
SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models Chris Liu Renrui Zhang Longtian Qiu Siyuan Huang Weifeng Lin ... Hao Shao Pan Lu Hongsheng Li Yu Qiao Peng Gao MLLM 130 107 0 08 Feb 2024
On the Standardization of Behavioral Use Clauses and Their Adoption for Responsible Licensing of AI Daniel J. McDuff Tim Korjakow Scott Cambo Jesse Josua Benjamin Jenny Lee ... Aaron Gokaslan Alek Tarkowski Joseph Lindley A. F. Cooper Danish Contractor MedIm 25 7 0 07 Feb 2024
ApiQ: Finetuning of 2-Bit Quantized Large Language Model Baohao Liao Christian Herold Shahram Khadivi Christof Monz CLL MQ 42 12 0 07 Feb 2024
UltraLink: An Open-Source Knowledge-Enhanced Multilingual Supervised Fine-tuning Dataset Haoyu Wang Shuo Wang Yukun Yan Xujia Wang Zhiyu Yang ... Liner Yang Ning Ding Xu Han Zhiyuan Liu Maosong Sun 16 0 0 07 Feb 2024
Tag-LLM: Repurposing General-Purpose LLMs for Specialized Domains Junhong Shen Neil Tenenholtz James Hall David Alvarez-Melis Nicolò Fusi 42 21 0 06 Feb 2024
Soft Prompt Tuning for Cross-Lingual Transfer: When Less is More Fred Philippy Siwen Guo Shohreh Haddadan Cedric Lothritz Jacques Klein Tegawende F. Bissyande AAML VLM 22 1 0 06 Feb 2024
MobileVLM V2: Faster and Stronger Baseline for Vision Language Model Xiangxiang Chu Limeng Qiao Xinyu Zhang Shuang Xu Fei Wei ... Xiaofei Sun Yiming Hu Xinyang Lin Bo-Wen Zhang Chunhua Shen VLM MLLM 22 95 0 06 Feb 2024
The Instinctive Bias: Spurious Images lead to Hallucination in MLLMs Tianyang Han Qing Lian Rui Pan Renjie Pi Jipeng Zhang Shizhe Diao Yong Lin Tong Zhang 73 1 0 06 Feb 2024
Professional Agents -- Evolving Large Language Models into Autonomous Experts with Human-Level Competencies Zhixuan Chu Yan Wang Feng Zhu Lu Yu Longfei Li Jinjie Gu LLMAG 23 8 0 06 Feb 2024
Less is KEN: a Universal and Simple Non-Parametric Pruning Algorithm for Large Language Models Michele Mastromattei Fabio Massimo Zanzotto VLM 26 1 0 05 Feb 2024
EasyInstruct: An Easy-to-use Instruction Processing Framework for Large Language Models Yixin Ou Ningyu Zhang Honghao Gui Ziwen Xu Shuofei Qiao ... Kangwei Liu Lei Li Zhen Bi Guozhou Zheng Huajun Chen SyDa 32 0 0 05 Feb 2024
A Survey on Transformer Compression Yehui Tang Yunhe Wang Jianyuan Guo Zhijun Tu Kai Han Hailin Hu Dacheng Tao 31 27 0 05 Feb 2024
Shortened LLaMA: Depth Pruning for Large Language Models with Comparison of Retraining Methods Bo-Kyeong Kim Geonmin Kim Tae-Ho Kim Thibault Castells Shinkook Choi Junho Shin Hyoung-Kyu Song 62 30 0 05 Feb 2024
From Partial to Strictly Incremental Constituent Parsing Ana Ezquerro Carlos Gómez-Rodríguez David Vilares 17 0 0 05 Feb 2024
IllusionX: An LLM-powered mixed reality personal companion Ramez Yousri Zeyad Essam Yehia Kareem Youstina Sherief Sherry Gamil Soha Safwat 22 3 0 04 Feb 2024
LHRS-Bot: Empowering Remote Sensing with VGI-Enhanced Large Multimodal Language Model Dilxat Muhtar Zhenshi Li Feng-Xue Gu Xue-liang Zhang P. Xiao 67 48 0 04 Feb 2024