Title
LQER: Low-Rank Quantization Error Reconstruction for LLMs Cheng Zhang Jianyi Cheng G. Constantinides Yiren Zhao MQ 24 9 0 04 Feb 2024
A Survey of Large Language Models in Finance (FinLLMs) Jean Lee Nicholas Stevens S. Han Minseok Song AIFin 28 55 0 04 Feb 2024
The Landscape and Challenges of HPC Research and LLMs Le Chen Nesreen K. Ahmed Akashnil Dutta Arijit Bhattacharjee Sixing Yu ... Vy A. Vo J. P. Muñoz Ted Willke Tim Mattson Ali Jannesari AI4CE 48 20 0 03 Feb 2024
COMET: Generating Commit Messages using Delta Graph Context Representation Abhinav Reddy Mandli Saurabhsingh Rajput Tushar Sharma 31 1 0 02 Feb 2024
OLMo: Accelerating the Science of Language Models Dirk Groeneveld Iz Beltagy Pete Walsh Akshita Bhagia Rodney Michael Kinney ... Jesse Dodge Kyle Lo Luca Soldaini Noah A. Smith Hanna Hajishirzi OSLM 135 355 0 01 Feb 2024
Non-Exchangeable Conformal Language Generation with Nearest Neighbors Dennis Ulmer Chrysoula Zerva André F. T. Martins 29 11 0 01 Feb 2024
CroissantLLM: A Truly Bilingual French-English Language Model Manuel Faysse Patrick Fernandes Nuno M. Guerreiro António Loison Duarte M. Alves ... François Yvon André F.T. Martins Gautier Viaud C´eline Hudelot Pierre Colombo 52 32 0 01 Feb 2024
Large Scale Generative AI Text Applied to Sports and Music Aaron Baughman Stephen Hammer Rahul Agarwal Gozde Akay Eduardo Morales Tony Johnson Leonid Karlinsky Rogerio Feris 14 3 0 31 Jan 2024
Multipath parsing in the brain Berta Franzluebbers Donald Dunagan Milovs Stanojević Jan Buys John T. Hale 10 0 0 31 Jan 2024
Probing Language Models' Gesture Understanding for Enhanced Human-AI Interaction Philipp Wicke 27 2 0 31 Jan 2024
Document Structure in Long Document Transformers Jan Buchmann Max Eichler Jan-Micha Bodensohn Ilia Kuznetsov Iryna Gurevych 13 2 0 31 Jan 2024
How Useful is Continued Pre-Training for Generative Unsupervised Domain Adaptation? Rheeya Uppaal Yixuan Li Junjie Hu 37 4 0 31 Jan 2024
Towards Unified Interactive Visual Grounding in The Wild Jie Xu Hanbo Zhang Qingyi Si Yifeng Li Xuguang Lan Tao Kong LM&Ro 30 5 0 30 Jan 2024
TeenyTinyLlama: open-source tiny language models trained in Brazilian Portuguese N. Corrêa Sophia Falk Shiza Fatimah Aniket Sen N. D. Oliveira 30 9 0 30 Jan 2024
LLaMandement: Large Language Models for Summarization of French Legislative Proposals Joseph Gesnouin Yannis Tannier Christophe Gomes Da Silva Hatim Tapory Camille Brier ... Emmanuel Cortes Pierre-Etienne Devineau Ulrich Tan Esther Mac Namara Su Yang AILaw 36 8 0 29 Jan 2024
VIALM: A Survey and Benchmark of Visually Impaired Assistance with Large Models Yi Zhao Yilin Zhang Rong Xiang Jing Li Hillming Li 40 16 0 29 Jan 2024
MoE-LLaVA: Mixture of Experts for Large Vision-Language Models Bin Lin Zhenyu Tang Yang Ye Jiaxi Cui Bin Zhu ... Jinfa Huang Junwu Zhang Yatian Pang Munan Ning Li-ming Yuan VLM MLLM MoE 35 152 0 29 Jan 2024
Evaluating Gender Bias in Large Language Models via Chain-of-Thought Prompting Masahiro Kaneko Danushka Bollegala Naoaki Okazaki Timothy Baldwin LRM 34 27 0 28 Jan 2024
Baichuan2-Sum: Instruction Finetune Baichuan2-7B Model for Dialogue Summarization Jianfei Xiao Yancan Chen Yimin Ou Hanyi Yu Kai Shu Yiyong Xiao ALM 22 11 0 27 Jan 2024
A Comprehensive Survey of Compression Algorithms for Language Models Seungcheol Park Jaehyeon Choi Sojin Lee U. Kang MQ 29 12 0 27 Jan 2024
Large Language Model Adaptation for Financial Sentiment Analysis Pau Rodriguez Inserte Mariam Nakhlé Raheel Qader Gaëtan Caillaut Jingshu Liu 25 13 0 26 Jan 2024
Do LLMs Dream of Ontologies? Marco Bombieri Paolo Fiorini Simone Paolo Ponzetto M. Rospocher CLL 24 2 0 26 Jan 2024
RomanSetu: Efficiently unlocking multilingual capabilities of Large Language Models via Romanization Jaavid Aktar Husain Raj Dabre Aswanth Kumar Jay Gala Thanmay Jayakumar Ratish Puduppully Anoop Kunchukuttan 30 12 0 25 Jan 2024
MaLA-500: Massive Language Adaptation of Large Language Models Peiqin Lin Shaoxiong Ji Jörg Tiedemann André F. T. Martins Hinrich Schütze ELM 23 15 0 24 Jan 2024
The Language Barrier: Dissecting Safety Challenges of LLMs in Multilingual Contexts Lingfeng Shen Weiting Tan Sihao Chen Yunmo Chen Jingyu Zhang Haoran Xu Boyuan Zheng Philipp Koehn Daniel Khashabi 34 38 0 23 Jan 2024
XAI for All: Can Large Language Models Simplify Explainable AI? Philip Mavrepis Georgios Makridis G. Fatouros Vasileios Koukos Maria Margarita Separdani D. Kyriazis 50 18 0 23 Jan 2024
BiTA: Bi-Directional Tuning for Lossless Acceleration in Large Language Models Feng-Huei Lin Hanling Yi Hongbin Li Yifan Yang Xiaotian Yu Guangming Lu Rong Xiao 39 3 0 23 Jan 2024
AI for social science and social science of AI: A Survey Ruoxi Xu Yingfei Sun Mengjie Ren Shiguang Guo Ruotong Pan Hongyu Lin Le Sun Xianpei Han 60 45 0 22 Jan 2024
Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs Ling Yang Zhaochen Yu Chenlin Meng Minkai Xu Stefano Ermon Bin Cui CoGe DiffM 39 114 0 22 Jan 2024
Detecting Multimedia Generated by Large AI Models: A Survey Li Lin Neeraj Gupta Yue Zhang Hainan Ren Chun-Hao Liu Feng Ding Xin Eric Wang X. Li Luisa Verdoliva Shu Hu 86 56 0 22 Jan 2024
LangBridge: Multilingual Reasoning Without Multilingual Supervision Dongkeun Yoon Joel Jang Sungdong Kim Seungone Kim Sheikh Shafayat Minjoon Seo LRM 24 14 0 19 Jan 2024
PHOENIX: Open-Source Language Adaption for Direct Preference Optimization Matthias Uhlig Sigurd Schacht Sudarshan Kamath Barkur ALM 14 1 0 19 Jan 2024
Breaking the Curse of Multilinguality with Cross-lingual Expert Language Models Terra Blevins Tomasz Limisiewicz Suchin Gururangan Margaret Li Hila Gonen Noah A. Smith Luke Zettlemoyer 44 22 0 19 Jan 2024
MLLM-Tool: A Multimodal Large Language Model For Tool Agent Learning Chenyu Wang Weixin Luo Qianyu Chen Haonan Mai Jindi Guo Sixun Dong Xiaohua Xuan MLLM LLMAG 44 19 0 19 Jan 2024
Beyond Traditional Benchmarks: Analyzing Behaviors of Open LLMs on Data-to-Text Generation Zdeněk Kasner Ondrej Dusek 33 8 0 18 Jan 2024
Code Simulation Challenges for Large Language Models Emanuele La Malfa Christoph Weinhuber Orazio Torre Fangru Lin Samuele Marro Anthony Cohn Nigel Shadbolt Michael Wooldridge LLMAG LRM 17 8 0 17 Jan 2024
EmoLLMs: A Series of Emotional Large Language Models and Annotation Tools for Comprehensive Affective Analysis Zhiwei Liu Kailai Yang Tianlin Zhang Qianqian Xie Sophia Ananiadou 19 39 0 16 Jan 2024
Machine Translation with Large Language Models: Prompt Engineering for Persian, English, and Russian Directions Nooshin Pourkamali Shler Ebrahim Sharifi LRM 44 9 0 16 Jan 2024
The What, Why, and How of Context Length Extension Techniques in Large Language Models -- A Detailed Survey Saurav Pawar S.M. Towhidul Islam Tonmoy S. M. M. Zaman Vinija Jain Aman Chadha Amitava Das 37 27 0 15 Jan 2024
Milestones in Bengali Sentiment Analysis leveraging Transformer-models: Fundamentals, Challenges and Future Directions Saptarshi Sengupta Shreya Ghosh Prasenjit Mitra Tarikul Islam Tamiti 35 0 0 15 Jan 2024
Activations and Gradients Compression for Model-Parallel Training Mikhail Rudakov Aleksandr Beznosikov Yaroslav Kholodov Alexander Gasnikov 26 1 0 15 Jan 2024
Developing ChatGPT for Biology and Medicine: A Complete Review of Biomedical Question Answering Qing Li Lei Li Yu Li LM&MA AI4MH 38 6 0 15 Jan 2024
Quantized Side Tuning: Fast and Memory-Efficient Tuning of Quantized Large Language Models Zhengxin Zhang Dan Zhao Xupeng Miao Gabriele Oliaro Qing Li Yong-jia Jiang Zhihao Jia MQ 33 7 0 13 Jan 2024
PUB: A Pragmatics Understanding Benchmark for Assessing LLMs' Pragmatics Capabilities S. Sravanthi Meet Doshi Tankala Pavan Kalyan Rudra Murthy Pushpak Bhattacharyya Raj Dabre 16 20 0 13 Jan 2024
xCoT: Cross-lingual Instruction Tuning for Cross-lingual Chain-of-Thought Reasoning Linzheng Chai Jian Yang Tao Sun Hongcheng Guo Jiaheng Liu ... Xiannian Liang Jiaqi Bai Tongliang Li Qiyao Peng Zhoujun Li LRM 34 48 0 13 Jan 2024
Mind Your Format: Towards Consistent Evaluation of In-Context Learning Improvements Anton Voronov Lena Wolf Max Ryabinin 22 46 0 12 Jan 2024
Adapting Large Language Models for Document-Level Machine Translation Minghao Wu Thuy-Trang Vu Lizhen Qu George F. Foster Gholamreza Haffari 82 42 0 12 Jan 2024
Extreme Compression of Large Language Models via Additive Quantization Vage Egiazarian Andrei Panferov Denis Kuznedelev Elias Frantar Artem Babenko Dan Alistarh MQ 100 88 0 11 Jan 2024
DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models Damai Dai Chengqi Deng Chenggang Zhao R. X. Xu Huazuo Gao ... Panpan Huang Fuli Luo Chong Ruan Zhifang Sui W. Liang MoE 36 246 0 11 Jan 2024
Tuning LLMs with Contrastive Alignment Instructions for Machine Translation in Unseen, Low-resource Languages Zhuoyuan Mao Yen Yu ALM 19 2 0 11 Jan 2024