Title
GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training Data Exploration Aleksandra Piktus Odunayo Ogundepo Christopher Akiki Akintunde Oladipo Xinyu Crystina Zhang Hailey Schoelkopf Stella Biderman Martin Potthast Jimmy J. Lin CVBM 36 10 0 02 Jun 2023
The RefinedWeb Dataset for Falcon LLM: Outperforming Curated Corpora with Web Data, and Web Data Only Guilherme Penedo Quentin Malartic Daniel Hesslow Ruxandra-Aimée Cojocaru Alessandro Cappelli Hamza Alobeidli B. Pannier Ebtesam Almazrouei Julien Launay 27 744 0 01 Jun 2023
AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration Ji Lin Jiaming Tang Haotian Tang Shang Yang Wei-Ming Chen Wei-Chen Wang Guangxuan Xiao Xingyu Dang Chuang Gan Song Han EDL MQ 25 463 0 01 Jun 2023
GPT4Image: Large Pre-trained Models Help Vision Models Learn Better on Perception Task Ning Ding Yehui Tang Zhongqian Fu Chaoting Xu Kai Han Yunhe Wang MLLM VLM 29 2 0 01 Jun 2023
The Impact of Positional Encoding on Length Generalization in Transformers Amirhossein Kazemnejad Inkit Padhi K. Ramamurthy Payel Das Siva Reddy 19 177 0 31 May 2023
GPT4GEO: How a Language Model Sees the World's Geography Jonathan Roberts Timo Lüddecke Sowmen Das Kai Han Samuel Albanie 19 58 0 30 May 2023
Intriguing Properties of Quantization at Scale Arash Ahmadian Saurabh Dash Hongyu Chen Bharat Venkitesh Stephen Gou Phil Blunsom A. Ustun Sara Hooker MQ 40 38 0 30 May 2023
Controlled Text Generation with Hidden Representation Transformations Vaibhav Kumar H. Koorehdavoudi Masud Moshtaghi Amita Misra Ankit Chadha Emilio Ferrara 18 3 0 30 May 2023
Marked Personas: Using Natural Language Prompts to Measure Stereotypes in Language Models Myra Cheng Esin Durmus Dan Jurafsky 25 174 0 29 May 2023
Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics Interface of LMs Through Agentivity Lindia Tjuatja Emmy Liu Lori S. Levin Graham Neubig 30 2 0 29 May 2023
BigTranslate: Augmenting Large Language Models with Multilingual Translation Capability over 100 Languages Wen Yang Chong Li Jiajun Zhang Chengqing Zong LRM 20 46 0 29 May 2023
A Systematic Study and Comprehensive Evaluation of ChatGPT on Benchmark Datasets Md Tahmid Rahman Laskar M Saiful Bari Mizanur Rahman Md Amran Hossen Bhuiyan Shafiq R. Joty J. Huang LM&MA ELM ALM 36 178 0 29 May 2023
LLM-QAT: Data-Free Quantization Aware Training for Large Language Models Zechun Liu Barlas Oğuz Changsheng Zhao Ernie Chang Pierre Stock Yashar Mehdad Yangyang Shi Raghuraman Krishnamoorthi Vikas Chandra MQ 42 187 0 29 May 2023
Large Language Models, scientific knowledge and factuality: A systematic analysis in antibiotic discovery Magdalena Wysocka Oskar Wysocki Maxime Delmas V. Mutel André Freitas LM&MA 30 6 0 28 May 2023
Language Models are Bounded Pragmatic Speakers: Understanding RLHF from a Bayesian Cognitive Modeling Perspective Khanh Nguyen LRM 24 8 0 28 May 2023
A Match Made in Heaven: A Multi-task Framework for Hyperbole and Metaphor Detection Naveen Badathala Abisek Rajakumar Kalarani Tejpalsingh Siledar P. Bhattacharyya 24 11 0 27 May 2023
Query-Efficient Black-Box Red Teaming via Bayesian Optimization Deokjae Lee JunYeong Lee Jung-Woo Ha Jin-Hwa Kim Sang-Woo Lee Hwaran Lee Hyun Oh Song AAML 11 23 0 27 May 2023
Im-Promptu: In-Context Composition from Image Prompts Bhishma Dedhia Michael Chang Jake C. Snell Thomas L. Griffiths N. Jha LRM MLLM 22 1 0 26 May 2023
RAMP: Retrieval and Attribute-Marking Enhanced Prompting for Attribute-Controlled Translation Gabriele Sarti Phu Mon Htut Xing Niu B. Hsu Anna Currey Georgiana Dinu Maria Nadejde LRM 35 9 0 26 May 2023
On Evaluating Adversarial Robustness of Large Vision-Language Models Yunqing Zhao Tianyu Pang Chao Du Xiao Yang Chongxuan Li Ngai-man Cheung Min-Bin Lin VLM AAML MLLM 14 166 0 26 May 2023
Parameter-Efficient Fine-Tuning without Introducing New Latency Baohao Liao Yan Meng Christof Monz 13 48 0 26 May 2023
Scaling Data-Constrained Language Models Niklas Muennighoff Alexander M. Rush Boaz Barak Teven Le Scao Aleksandra Piktus Nouamane Tazi S. Pyysalo Thomas Wolf Colin Raffel ALM 21 197 0 25 May 2023
Understanding the Capabilities of Large Language Models for Automated Planning Vishal Pallagani Bharath Muppasani K. Murugesan F. Rossi Biplav Srivastava L. Horesh F. Fabiano Andrea Loreggia LLMAG ELM 19 36 0 25 May 2023
Language Models Implement Simple Word2Vec-style Vector Arithmetic Jack Merullo Carsten Eickhoff Ellie Pavlick KELM 26 52 0 25 May 2023
Automated Tensor Model Parallelism with Overlapped Communication for Efficient Foundation Model Training Shengwei Li Zhiquan Lai Yanqi Hao Weijie Liu Ke-shi Ge Xiaoge Deng Dongsheng Li KaiCheng Lu 11 10 0 25 May 2023
ChatBridge: Bridging Modalities with Large Language Model as a Language Catalyst Zijia Zhao Longteng Guo Tongtian Yue Si-Qing Chen Shuai Shao Xinxin Zhu Zehuan Yuan Jing Liu MLLM 32 52 0 25 May 2023
PandaGPT: One Model To Instruction-Follow Them All Yixuan Su Tian Lan Huayang Li Jialu Xu Yan Wang Deng Cai MLLM 34 274 0 25 May 2023
Revisiting non-English Text Simplification: A Unified Multilingual Benchmark Michael Joseph Ryan Tarek Naous Wei-ping Xu 24 24 0 25 May 2023
Towards Revealing the Mystery behind Chain of Thought: A Theoretical Perspective Guhao Feng Bohang Zhang Yuntian Gu Haotian Ye Di He Liwei Wang LRM 27 214 0 24 May 2023
Gorilla: Large Language Model Connected with Massive APIs Shishir G. Patil Tianjun Zhang Xin Wang Joseph E. Gonzalez ELM CLL ALM SyDa 22 507 0 24 May 2023
Science in the Era of ChatGPT, Large Language Models and Generative AI: Challenges for Research Ethics and How to Respond Evangelos Pournaras 20 4 0 24 May 2023
MultiFusion: Fusing Pre-Trained Models for Multi-Lingual, Multi-Modal Image Generation Marco Bellagente Manuel Brack H. Teufel Felix Friedrich Bjorn Deiseroth ... Koen Oostermeijer Andres Felipe Cruz Salinas P. Schramowski Kristian Kersting Samuel Weinbach 36 15 0 24 May 2023
EvEval: A Comprehensive Evaluation of Event Semantics for Large Language Models Zhengwei Tao Zhi Jin Xiaoying Bai Haiyan Zhao Yanlin Feng Jia Li Wenpeng Hu 19 4 0 24 May 2023
Revisiting Parallel Context Windows: A Frustratingly Simple Alternative and Chain-of-Thought Deterioration Kejuan Yang Xiao Liu Kaiwen Men Aohan Zeng Yuxiao Dong Jie Tang LLMAG LRM 16 3 0 24 May 2023
Spoken Question Answering and Speech Continuation Using Spectrogram-Powered LLM Eliya Nachmani Alon Levkovitch Roy Hirsch Julián Salazar Chulayutsh Asawaroengchai Soroosh Mariooryad Ehud Rivlin RJ Skerry-Ryan Michelle Tadmor Ramanovich AuLLM 19 30 0 24 May 2023
Cross-lingual QA: A Key to Unlocking In-context Cross-lingual Performance SunKyoung Kim Dayeon Ki Yireun Kim Jinsik Lee LRM 11 3 0 24 May 2023
Eliciting the Translation Ability of Large Language Models via Multilingual Finetuning with Translation Instructions Jiahuan Li Hao Zhou Shujian Huang Shan Chen Jiajun Chen LRM 30 54 0 24 May 2023
An Efficient Multilingual Language Model Compression through Vocabulary Trimming Asahi Ushio Yi Zhou Jose Camacho-Collados 39 7 0 24 May 2023
Bactrian-X: Multilingual Replicable Instruction-Following Models with Low-Rank Adaptation Haonan Li Fajri Koto Minghao Wu Alham Fikri Aji Timothy Baldwin ALM 16 74 0 24 May 2023
LLMDet: A Third Party Large Language Models Generated Text Detection Tool Kangxi Wu Liang Pang Huawei Shen Xueqi Cheng Tat-Seng Chua DeLMO 27 37 0 24 May 2023
Investigating Table-to-Text Generation Capabilities of LLMs in Real-World Information Seeking Scenarios Yilun Zhao Haowei Zhang Shengyun Si Linyong Nan Xiangru Tang Arman Cohan LMTD 22 12 0 24 May 2023
LAraBench: Benchmarking Arabic AI with Large Language Models Ahmed Abdelali Hamdy Mubarak Shammur A. Chowdhury Maram Hasanain Basel Mousi ... Yousseif Elshahawy Ahmed M. Ali Nadir Durrani Natasa Milic-Frayling Firoj Alam ELM LM&MA 16 19 0 24 May 2023
Tricking LLMs into Disobedience: Formalizing, Analyzing, and Detecting Jailbreaks Abhinav Rao S. Vashistha Atharva Naik Somak Aditya Monojit Choudhury 25 17 0 24 May 2023
Do LLMs Understand Social Knowledge? Evaluating the Sociability of Large Language Models with SocKET Benchmark Minje Choi Jiaxin Pei Sagar Kumar Chang Shu David Jurgens ALM LLMAG 19 69 0 24 May 2023
PIVOINE: Instruction Tuning for Open-world Information Extraction K. Lu Xiaoman Pan Kaiqiang Song Hongming Zhang Dong Yu Jianshu Chen 18 10 0 24 May 2023
Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis Sohee Yang Jonghyeon Kim Joel Jang Seonghyeon Ye Hyunji Lee Minjoon Seo 28 9 0 24 May 2023
BUFFET: Benchmarking Large Language Models for Few-shot Cross-lingual Transfer Akari Asai Sneha Kudugunta Xinyan Velocity Yu Terra Blevins Hila Gonen Machel Reid Yulia Tsvetkov Sebastian Ruder Hannaneh Hajishirzi 31 53 0 24 May 2023
Allies: Prompting Large Language Model with Beam Search Hao-Lun Sun Xiao Liu Yeyun Gong Yan Zhang Daxin Jiang Linjun Yang Nan Duan RALM 28 5 0 24 May 2023
Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models Sheng Shen Le Hou Yan-Quan Zhou Nan Du Shayne Longpre ... Vincent Zhao Hongkun Yu Kurt Keutzer Trevor Darrell Denny Zhou ALM MoE 25 54 0 24 May 2023
This Land is {Your, My} Land: Evaluating Geopolitical Biases in Language Models Bryan Li Samar Haider Chris Callison-Burch 10 16 0 24 May 2023