Title
Scaling Law with Learning Rate Annealing Howe Tissue Venus Wang Lu Wang 21 7 0 20 Aug 2024
SZTU-CMU at MER2024: Improving Emotion-LLaMA with Conv-Attention for Multimodal Emotion Recognition Zebang Cheng Shuyuan Tu Dawei Huang Minghan Li Xiaojiang Peng Zhi-Qi Cheng Alexander G. Hauptmann 43 2 0 20 Aug 2024
Bridging the Language Gap: Enhancing Multilingual Prompt-Based Code Generation in LLMs via Zero-Shot Cross-Lingual Transfer Mingda Li Abhijit Mishra Utkarsh Mujumdar 34 0 0 19 Aug 2024
Towards Boosting LLMs-driven Relevance Modeling with Progressive Retrieved Behavior-augmented Prompting Zeyuan Chen Haiyan Wu Kaixin Wu Wei Chen Mingjie Zhong Jia Xu Zhongyi Liu Wei Zhang 38 1 0 18 Aug 2024
The Future of Open Human Feedback Shachar Don-Yehiya Ben Burtenshaw Ramon Fernandez Astudillo Cailean Osborne Mimansa Jaiswal ... Omri Abend Jennifer Ding Sara Hooker Hannah Rose Kirk Leshem Choshen VLM ALM 62 4 0 15 Aug 2024
Fast Training Dataset Attribution via In-Context Learning Milad Fotouhi M. T. Bahadori Oluwaseyi Feyisetan P. Arabshahi David Heckerman 31 0 0 14 Aug 2024
A Survey on Model MoErging: Recycling and Routing Among Specialized Experts for Collaborative Learning Prateek Yadav Colin Raffel Mohammed Muqeeth Lucas Page-Caccia Haokun Liu Tianlong Chen Mohit Bansal Leshem Choshen Alessandro Sordoni MoMe 38 21 0 13 Aug 2024
Does Liking Yellow Imply Driving a School Bus? Semantic Leakage in Language Models Hila Gonen Terra Blevins Alisa Liu Luke Zettlemoyer Noah A. Smith 26 5 0 12 Aug 2024
FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data Haoran Sun Renren Jin Shaoyang Xu Leiyu Pan Supryadi ... Lei Yang Ling Shi Juesi Xiao Shaolin Zhu Deyi Xiong 52 0 0 12 Aug 2024
LUT Tensor Core: A Software-Hardware Co-Design for LUT-Based Low-Bit LLM Inference Zhiwen Mo Lei Wang Jianyu Wei Zhichen Zeng Shijie Cao ... Naifeng Jing Ting Cao Jilong Xue Fan Yang Mao Yang 54 4 0 12 Aug 2024
Context-Driven Index Trimming: A Data Quality Perspective to Enhancing Precision of RALMs Kexin Ma Ruochun Jin Xi Wang Huan Chen Jing Ren Yuhua Tang 25 0 0 10 Aug 2024
Your Context Is Not an Array: Unveiling Random Access Limitations in Transformers MohammadReza Ebrahimi Sunny Panchal Roland Memisevic 25 5 0 10 Aug 2024
LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP Danlu Chen Freda Shi Aditi Agarwal Jacobo Myerston Taylor Berg-Kirkpatrick 27 2 0 08 Aug 2024
Evaluating the Translation Performance of Large Language Models Based on Euas-20 Yan Huang Wei Liu ELM 35 0 0 06 Aug 2024
Large Model Strategic Thinking, Small Model Efficiency: Transferring Theory of Mind in Large Language Models Nunzio Lorè Alireza Ilami Babak Heydari LRM 37 0 0 05 Aug 2024
From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation Xin Liu Chao Hao Zitong Yu Huanjing Yue Jingyu Yang 29 1 0 05 Aug 2024
Effective Demonstration Annotation for In-Context Learning via Language Model-Based Determinantal Point Process Peng Wang Xiaobin Wang Chao Lou Shengyu Mao Pengjun Xie Yong-jia Jiang 52 0 0 04 Aug 2024
Cross-layer Attention Sharing for Large Language Models Yongyu Mu Yuzhang Wu Yuchun Fan Chenglong Wang Hengyu Li Qiaozhi He Murun Yang Tong Xiao Jingbo Zhu 31 5 0 04 Aug 2024
A Comprehensive Review of Multimodal Large Language Models: Performance and Challenges Across Different Tasks Jiaqi Wang Hanqi Jiang Yi-Hsueh Liu Chong Ma Xu-Yao Zhang ... Xin Zhang Wei Zhang Dinggang Shen Tianming Liu Shu Zhang VLM AI4TS 42 30 0 02 Aug 2024
The Impact of Hyperparameters on Large Language Model Inference Performance: An Evaluation of vLLM and HuggingFace Pipelines Agathe Balayn 40 2 0 02 Aug 2024
DynamoLLM: Designing LLM Inference Clusters for Performance and Energy Efficiency Jovan Stojkovic Chaojie Zhang Íñigo Goiri Josep Torrellas Esha Choukse 35 29 0 01 Aug 2024
Enabling Contextual Soft Moderation on Social Media through Contrastive Textual Deviation Pujan Paudel Mohammad Hammas Saeed Rebecca Auger Chris Wells Gianluca Stringhini 62 1 0 30 Jul 2024
ThinK: Thinner Key Cache by Query-Driven Pruning Yuhui Xu Zhanming Jie Hanze Dong Lei Wang Xudong Lu Aojun Zhou Amrita Saha Caiming Xiong Doyen Sahoo 67 14 0 30 Jul 2024
Efficient Training of Large Language Models on Distributed Infrastructures: A Survey Jiangfei Duan Shuo Zhang Zerui Wang Lijuan Jiang Wenwen Qu ... Dahua Lin Yonggang Wen Xin Jin Tianwei Zhang Peng Sun 69 8 0 29 Jul 2024
Is Generative AI an Existential Threat to Human Creatives? Insights from Financial Economics Jiasun Li 24 0 0 28 Jul 2024
SaulLM-54B & SaulLM-141B: Scaling Up Domain Adaptation for the Legal Domain Pierre Colombo T. Pires Malik Boudiaf Rui Melo Dominic Culver Sofia Morgado Etienne Malaboeuf Gabriel Hautreux Johanne Charpentier Michael Desa ELM AILaw ALM 35 12 0 28 Jul 2024
Greedy Output Approximation: Towards Efficient Structured Pruning for LLMs Without Retraining Jianwei Li Yijun Dong Qi Lei 21 5 0 26 Jul 2024
Fairness Definitions in Language Models Explained Thang Viet Doan Zhibo Chu Zichong Wang Wenbin Zhang ALM 50 10 0 26 Jul 2024
Enhancing Model Performance: Another Approach to Vision-Language Instruction Tuning Vedanshu M. M. Tripathi Bhavnesh Jaint MLLM VLM 32 0 0 25 Jul 2024
Reporting and Analysing the Environmental Impact of Language Models on the Example of Commonsense Question Answering with External Knowledge Aida Usmanova Junbo Huang Debayan Banerjee Ricardo Usbeck 14 1 0 24 Jul 2024
Accurate and Efficient Fine-Tuning of Quantized Large Language Models Through Optimal Balance Ao Shen Qiang Wang Zhiquan Lai Xionglve Li Dongsheng Li ALM MQ 19 1 0 24 Jul 2024
Enhancing LLM's Cognition via Structurization Kai-Chun Liu Zhihang Fu Chao Chen Wei Zhang Rongxin Jiang Fan Zhou Yao-Shen Chen Yue-bo Wu Jieping Ye 45 1 0 23 Jul 2024
Graph-Structured Speculative Decoding Zhuocheng Gong Jiahao Liu Ziyue Wang Pengfei Wu Jingang Wang Xunliang Cai Dongyan Zhao Rui Yan 21 3 0 23 Jul 2024
Compensate Quantization Errors+: Quantized Models Are Inquisitive Learners Yifei Gao Jie Ou Lei Wang Fanhua Shang Jaji Wu MQ 40 0 0 22 Jul 2024
Consent in Crisis: The Rapid Decline of the AI Data Commons Shayne Longpre Robert Mahari Ariel N. Lee Campbell Lund Hamidah Oderinwale ... Hanlin Li Daphne Ippolito Sara Hooker Jad Kabbara Sandy Pentland 56 35 0 20 Jul 2024
Impact of Model Size on Fine-tuned LLM Performance in Data-to-Text Generation: A State-of-the-Art Investigation Joy Mahapatra Utpal Garain 29 8 0 19 Jul 2024
ANHALTEN: Cross-Lingual Transfer for German Token-Level Reference-Free Hallucination Detection Janek Herrlein Chia-Chien Hung Goran Glavavs HILM 17 1 0 18 Jul 2024
Scaling Laws with Vocabulary: Larger Models Deserve Larger Vocabularies Chaofan Tao Qian Liu Longxu Dou Niklas Muennighoff Zhongwei Wan Ping Luo Min-Bin Lin Ngai Wong PILM 50 45 0 18 Jul 2024
Reconstruct the Pruned Model without Any Retraining Pingjie Wang Ziqing Fan Shengchao Hu Zhe Chen Yanfeng Wang Yu Wang 30 1 0 18 Jul 2024
SpeciaLex: A Benchmark for In-Context Specialized Lexicon Learning Joseph Marvin Imperial Harish Tayyar Madabushi 25 1 0 18 Jul 2024
INDIC QA BENCHMARK: A Multilingual Benchmark to Evaluate Question Answering capability of LLMs for Indic Languages A. Singh Rudra Murthy Vishwajeet Kumar Jaydeep Sen Ashish Mittal Ganesh Ramakrishnan 35 6 0 18 Jul 2024
Scientific QA System with Verifiable Answers Adela Ljajić Milos Kosprdic Bojana Bašaragin Darija Medvecki Lorenzo Cassano Nikola Milosevic 19 1 0 16 Jul 2024
The Oscars of AI Theater: A Survey on Role-Playing with Language Models Nuo Chen Yan Wang Yang Deng Jia Li 26 14 0 16 Jul 2024
TCM-FTP: Fine-Tuning Large Language Models for Herbal Prescription Prediction Xingzhi Zhou Xin Dong Chunhao Li Yuning Bai Yulong Xu ... Simon See Xinpeng Song Runshun Zhang Xuezhong Zhou Nevin L. Zhang LM&MA 24 3 0 15 Jul 2024
Look Within, Why LLMs Hallucinate: A Causal Perspective He Li Haoang Chi Mingyu Liu Wenjing Yang LRM 29 3 0 14 Jul 2024
Bilingual Adaptation of Monolingual Foundation Models Gurpreet Gosal Yishi Xu Gokul Ramakrishnan Rituraj Joshi Avraham Sheinin ... Rahul Pal Parvez Mullah Soundar Doraiswamy Mohamed El Karim Chami Preslav Nakov CLL 21 3 0 13 Jul 2024
NativQA: Multilingual Culturally-Aligned Natural Query for LLMs Md. Arid Hasan Maram Hasanain Fatema Ahmad Sahinur Rahman Laskar Sunaya Upadhyay Vrunda N. Sukhadia Mucahid Kutlu Shammur A. Chowdhury Firoj Alam 45 4 0 13 Jul 2024
Mitigating Entity-Level Hallucination in Large Language Models Weihang Su Yichen Tang Qingyao Ai Changyue Wang Zhijing Wu Yiqun Liu HILM 21 6 0 12 Jul 2024
A Survey on Symbolic Knowledge Distillation of Large Language Models Kamal Acharya Alvaro Velasquez H. Song SyDa 29 4 0 12 Jul 2024
Domain-Hierarchy Adaptation via Chain of Iterative Reasoning for Few-shot Hierarchical Text Classification Ke Ji Peng Wang Wenjun Ke Guozheng Li Jiajun Liu Jingsheng Gao Ziyu Shang BDL 31 2 0 12 Jul 2024