Title
DRAGIN: Dynamic Retrieval Augmented Generation based on the Information Needs of Large Language Models Weihang Su Yichen Tang Qingyao Ai Zhijing Wu Yiqun Liu 3DV RALM AI4TS SyDa 51 18 0 15 Mar 2024
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models Chaoqun Liu Wenxuan Zhang Yiran Zhao A. Luu Lidong Bing LRM 39 9 0 15 Mar 2024
LMStyle Benchmark: Evaluating Text Style Transfer for Chatbots Jianlin Chen 38 4 0 13 Mar 2024
Simple and Scalable Strategies to Continually Pre-train Large Language Models Adam Ibrahim Benjamin Thérien Kshitij Gupta Mats L. Richter Quentin Anthony Timothée Lesort Eugene Belilovsky Irina Rish KELM CLL 44 51 0 13 Mar 2024
The Garden of Forking Paths: Observing Dynamic Parameters Distribution in Large Language Models Carlo Nicolini Jacopo Staiano Bruno Lepri Raffaele Marino MoE 26 1 0 13 Mar 2024
Strengthening Multimodal Large Language Model with Bootstrapped Preference Optimization Renjie Pi Tianyang Han Wei Xiong Jipeng Zhang Runtao Liu Rui Pan Tong Zhang MLLM 35 33 0 13 Mar 2024
Token Alignment via Character Matching for Subword Completion Ben Athiwaratkun Shiqi Wang Mingyue Shang Yuchen Tian Zijian Wang Sujan Kumar Gonugondla Sanjay Krishna Gouda Rob Kwiatowski Ramesh Nallapati Bing Xiang 40 4 0 13 Mar 2024
Language models scale reliably with over-training and on downstream tasks S. Gadre Georgios Smyrnis Vaishaal Shankar Suchin Gururangan Mitchell Wortsman ... Y. Carmon Achal Dave Reinhard Heckel Niklas Muennighoff Ludwig Schmidt ALM ELM LRM 106 40 0 13 Mar 2024
MoleculeQA: A Dataset to Evaluate Factual Accuracy in Molecular Comprehension Xingyu Lu He Cao Zijing Liu Shengyuan Bai Leqing Chen Yuan Yao Hai-Tao Zheng Yu Li HILM 19 6 0 13 Mar 2024
Rethinking Generative Large Language Model Evaluation for Semantic Comprehension Fangyun Wei Xi Chen Linzi Luo ELM ALM LRM 30 7 0 12 Mar 2024
generAItor: Tree-in-the-Loop Text Generation for Language Model Explainability and Adaptation Thilo Spinner Rebecca Kehlbeck R. Sevastjanova Tobias Stähle Daniel A. Keim Oliver Deussen Mennatallah El-Assady 46 3 0 12 Mar 2024
FocusCLIP: Multimodal Subject-Level Guidance for Zero-Shot Transfer in Human-Centric Tasks Muhammad Gul Zain Ali Khan Muhammad Ferjad Naeem F. Tombari Luc Van Gool Didier Stricker Muhammad Zeshan Afzal VLM CLIP 33 3 0 11 Mar 2024
ConspEmoLLM: Conspiracy Theory Detection Using an Emotion-Based Large Language Model Zhiwei Liu Boyang Liu Paul Thompson Kailai Yang Sophia Ananiadou 32 3 0 11 Mar 2024
ACT-MNMT Auto-Constriction Turning for Multilingual Neural Machine Translation Shaojie Dai Xin Liu Ping Luo Yue Yu LRM 24 1 0 11 Mar 2024
Smart-Infinity: Fast Large Language Model Training using Near-Storage Processing on a Real System Hongsun Jang Jaeyong Song Jaewon Jung Jaeyoung Park Youngsok Kim Jinho Lee 29 11 0 11 Mar 2024
QuantTune: Optimizing Model Quantization with Adaptive Outlier-Driven Fine Tuning Jiun-Man Chen Yu-Hsuan Chao Yu-Jie Wang Ming-Der Shieh Chih-Chung Hsu Wei-Fen Lin MQ 24 1 0 11 Mar 2024
Unsupervised Real-Time Hallucination Detection based on the Internal States of Large Language Models Weihang Su Changyue Wang Qingyao Ai Hu Yiran Zhijing Wu Yujia Zhou Yiqun Liu HILM 37 28 0 11 Mar 2024
No Language is an Island: Unifying Chinese and English in Financial Large Language Models, Instruction Data, and Benchmarks Gang Hu Ke Qin Chenhan Yuan Min Peng Alejandro Lopez-Lira Benyou Wang Sophia Ananiadou Wanlong Yu Jimin Huang Qianqian Xie 30 4 0 10 Mar 2024
Cost-Performance Optimization for Processing Low-Resource Language Tasks Using Commercial LLMs Arijit Nag Animesh Mukherjee Niloy Ganguly Soumen Chakrabarti 38 2 0 08 Mar 2024
MEIT: Multi-Modal Electrocardiogram Instruction Tuning on Large Language Models for Report Generation Zhongwei Wan Che Liu Xin Wang Chaofan Tao Hui Shen Zhenwu Peng Jie Fu Rossella Arcucci Huaxiu Yao Mi Zhang 47 7 0 07 Mar 2024
Chain of Thought Explanation for Dialogue State Tracking Lin Xu Ningxin Peng Daquan Zhou See-Kiong Ng Jinlan Fu LRM 27 1 0 07 Mar 2024
Where does In-context Translation Happen in Large Language Models Suzanna Sia David Mueller Kevin Duh LRM 33 0 0 07 Mar 2024
Low-Resource Court Judgment Summarization for Common Law Systems Shuaiqi Liu Jiannong Cao Yicong Li Ruosong Yang Zhiyuan Wen ELM AILaw 20 2 0 07 Mar 2024
LORS: Low-rank Residual Structure for Parameter-Efficient Network Stacking Jialin Li Qiang Nie Weifu Fu Yuhuan Lin Guangpin Tao Yong-Jin Liu Chengjie Wang 25 4 0 07 Mar 2024
SaulLM-7B: A pioneering Large Language Model for Law Pierre Colombo T. Pires Malik Boudiaf Dominic Culver Rui Melo ... Andre F. T. Martins Fabrizio Esposito Vera Lúcia Raposo Sofia Morgado Michael Desa ELM AILaw 39 63 0 06 Mar 2024
Evaluating the Elementary Multilingual Capabilities of Large Language Models with MultiQ Carolin Holtermann Paul Röttger Timm Dill Anne Lauscher ELM LRM 32 22 0 06 Mar 2024
General2Specialized LLMs Translation for E-commerce Kaidi Chen Ben Chen Dehong Gao Huangyu Dai Wen Jiang Wei Ning Shanqing Yu Libin Yang Xiaoyan Cai 13 8 0 06 Mar 2024
Reliable, Adaptable, and Attributable Language Models with Retrieval Akari Asai Zexuan Zhong Danqi Chen Pang Wei Koh Luke Zettlemoyer Hanna Hajishirzi Wen-tau Yih KELM RALM 41 53 0 05 Mar 2024
EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs Hanlin Tang Yifu Sun Decheng Wu Kai Liu Jianchen Zhu Zhanhui Kang MQ 28 10 0 05 Mar 2024
Towards Training A Chinese Large Language Model for Anesthesiology Zhonghai Wang Jie Jiang Yibing Zhan Bohao Zhou Yanhong Li ... Liang Ding Hua Jin Jun Peng Xu Lin Weifeng Liu LM&MA 30 3 0 05 Mar 2024
Crossing Linguistic Horizons: Finetuning and Comprehensive Evaluation of Vietnamese Large Language Models Sang T. Truong D. Q. Nguyen Toan Nguyen Dong D. Le Nhi N. Truong Tho Quan Oluwasanmi Koyejo 37 2 0 05 Mar 2024
Breeze-7B Technical Report Chan-Jan Hsu Chang-Le Liu Feng-Ting Liao Po-Chun Hsu Yi-Chang Chen Da-shan Shiu 26 2 0 05 Mar 2024
Better Schedules for Low Precision Training of Deep Neural Networks Cameron R. Wolfe Anastasios Kyrillidis 40 1 0 04 Mar 2024
Fostering the Ecosystem of Open Neural Encoders for Portuguese with Albertina PT* Family Rodrigo Santos João Rodrigues Luís Gomes Joao Silva António Branco Henrique Lopes Cardoso T. Osório Bernardo Leite 33 8 0 04 Mar 2024
DéjàVu: KV-cache Streaming for Fast, Fault-tolerant Generative LLM Serving F. Strati Sara Mcallister Amar Phanishayee Jakub Tarnawski Ana Klimovic 28 24 0 04 Mar 2024
An Improved Traditional Chinese Evaluation Suite for Foundation Model Zhi Rui Tam Ya-Ting Pai Yen-Wei Lee Jun-Da Chen Wei-Min Chu Sega Cheng Hong-Han Shuai ELM 32 11 0 04 Mar 2024
NusaBERT: Teaching IndoBERT to be Multilingual and Multicultural Wilson Wongso David Samuel Setiawan Steven Limcorn Ananto Joyoadikusumo 32 1 0 04 Mar 2024
VBART: The Turkish LLM Meliksah Turker Mehmet Erdi Ari Aydin Han VLM 31 4 0 02 Mar 2024
LLM-PQ: Serving LLM on Heterogeneous Clusters with Phase-Aware Partition and Adaptive Quantization Juntao Zhao Borui Wan Yanghua Peng Haibin Lin Chuan Wu MQ 41 13 0 02 Mar 2024
Formulation Comparison for Timeline Construction using LLMs Kimihiro Hasegawa Nikhil Kandukuri Susan Holm Yukari Yamakawa Teruko Mitamura 36 0 0 01 Mar 2024
A Bit of a Problem: Measurement Disparities in Dataset Sizes Across Languages Catherine Arnett Tyler A. Chang Benjamin Bergen 29 3 0 01 Mar 2024
VisionLLaMA: A Unified LLaMA Backbone for Vision Tasks Xiangxiang Chu Jianlin Su Bo-Wen Zhang Chunhua Shen MLLM 30 10 0 01 Mar 2024
WanJuan-CC: A Safe and High-Quality Open-sourced English Webtext Dataset Jiantao Qiu Haijun Lv Zhenjiang Jin Rui Wang Wenchang Ning ... Zhongying Tu Lin Dahua Yu Qiao Hang Yan Conghui He 31 6 0 29 Feb 2024
Memory-Augmented Generative Adversarial Transformers Stephan Raaijmakers Roos Bakker Anita Cremers R. D. Kleijn Tom Kouwenhoven Tessa Verhoef 33 0 0 29 Feb 2024
Teaching Large Language Models an Unseen Language on the Fly Chen Zhang Xiao Liu Jiuheng Lin Yansong Feng 30 18 0 29 Feb 2024
Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Model Hao-Ran Cheng Erjia Xiao Jindong Gu Le Yang Jinhao Duan Jize Zhang Jiahang Cao Kaidi Xu Renjing Xu 29 6 0 29 Feb 2024
Enhancing Visual Document Understanding with Contrastive Learning in Large Visual-Language Models Xin Li Yunfei Wu Xinghua Jiang Zhihao Guo Ming Gong Haoyu Cao Yinsong Liu Deqiang Jiang Xing Sun VLM 29 12 0 29 Feb 2024
Advancing Generative AI for Portuguese with Open Decoder Gervásio PT* Rodrigo Santos Joao Silva Luís Gomes João Rodrigues António Branco 44 10 0 29 Feb 2024
EBBS: An Ensemble with Bi-Level Beam Search for Zero-Shot Machine Translation Yuqiao Wen Behzad Shayegh Chenyang Huang Yanshuai Cao Lili Mou 48 4 0 29 Feb 2024
FlexLLM: A System for Co-Serving Large Language Model Inference and Parameter-Efficient Finetuning Xupeng Miao Gabriele Oliaro Xinhao Cheng Vineeth Kada Ruohan Gao ... April Yang Yingcheng Wang Mengdi Wu Colin Unger Zhihao Jia MoE 94 9 0 29 Feb 2024