Title
Efficient and Effective Text Encoding for Chinese LLaMA and Alpaca Yiming Cui Ziqing Yang Xin Yao ALM 26 292 0 17 Apr 2023
A Comparative Study between Full-Parameter and LoRA-based Fine-Tuning on Chinese Instruction Data for Instruction Following Large Language Model Xianghui Sun Yunjie Ji Baochang Ma Xiangang Li ALM 6 17 0 17 Apr 2023
Towards Better Instruction Following Language Models for Chinese: Investigating the Impact of Training Data and Evaluation Yunjie Ji Yan Gong Yong Deng Yiping Peng Qiang Niu Baochang Ma Xiangang Li ALM ELM 22 22 0 16 Apr 2023
SikuGPT: A Generative Pre-trained Model for Intelligent Information Processing of Ancient Texts from the Perspective of Digital Humanities Chang Liu Dongbo Wang Zhixiao Zhao Die Hu Mengcheng Wu ... Si Shen Bin Li Jiangfeng Liu Hai Zhang Lianzheng Zhao 12 9 0 16 Apr 2023
ChatGPT: Applications, Opportunities, and Threats Aram Bahrini Mohammadsadra Khamoshifar H. Abbasimehr R. Riggs Maryam Esmaeili Rastin Mastali Majdabadkohne Morteza Pasehvar LLMAG AI4MH 16 128 0 14 Apr 2023
RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment Hanze Dong Wei Xiong Deepanshu Goyal Yihan Zhang Winnie Chow Rui Pan Shizhe Diao Jipeng Zhang Kashun Shum Tong Zhang ALM 6 399 0 13 Apr 2023
Adversarial Examples from Dimensional Invariance Benjamin L. Badger 15 0 0 13 Apr 2023
Computational modeling of semantic change Nina Tahmasebi Haim Dubossarsky 26 6 0 13 Apr 2023
AGI for Agriculture Guoyu Lu Sheng R. Li Gengchen Mai Jin Sun Dajiang Zhu ... R. Xu Daniel Petti Changying Li Tianming Liu Changying Li AI4CE 25 17 0 12 Apr 2023
ImageReward: Learning and Evaluating Human Preferences for Text-to-Image Generation Jiazheng Xu Xiao Liu Yuchen Wu Yuxuan Tong Qinkai Li Ming Ding Jie Tang Yuxiao Dong 20 310 0 12 Apr 2023
ChatGPT Beyond English: Towards a Comprehensive Evaluation of Large Language Models in Multilingual Learning Viet Dac Lai Nghia Trung Ngo Amir Pouran Ben Veyseh Hieu Man Franck Dernoncourt Trung Bui Thien Huu Nguyen ELM LM&MA 25 267 0 12 Apr 2023
Multilingual Machine Translation with Large Language Models: Empirical Results and Analysis Wenhao Zhu Hongyi Liu Qingxiu Dong Jingjing Xu Shujian Huang Lingpeng Kong Jiajun Chen Lei Li LRM 29 139 0 10 Apr 2023
Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder Z. Fu W. Lam Qian Yu Anthony Man-Cho So Shengding Hu Zhiyuan Liu Nigel Collier AuLLM 23 41 0 08 Apr 2023
Instruction Tuning with GPT-4 Baolin Peng Chunyuan Li Pengcheng He Michel Galley Jianfeng Gao SyDa ALM LM&MA 157 579 0 06 Apr 2023
Cerebras-GPT: Open Compute-Optimal Language Models Trained on the Cerebras Wafer-Scale Cluster Nolan Dey Gurpreet Gosal Zhiming Chen Chen Hemant Khachane William Marshall Ribhu Pathria Marvin Tom Joel Hestness MoE LRM 25 98 0 06 Apr 2023
ParroT: Translating during Chat using Large Language Models tuned with Human Translation and Feedback Wenxiang Jiao Jen-tse Huang Wenxuan Wang Zhiwei He Tian Liang Xing Wang Shuming Shi Zhaopeng Tu ALM 44 44 0 05 Apr 2023
LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language Models Zhiqiang Hu Lei Wang Yihuai Lan Wanyu Xu Ee-Peng Lim Lidong Bing Xing Xu Soujanya Poria Roy Ka-Wei Lee ALM 29 229 0 04 Apr 2023
Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks Yixuan Weng Minjun Zhu Fei Xia Bin Li Shizhu He Kang Liu Jun Zhao 23 4 0 04 Apr 2023
Efficiently Aligned Cross-Lingual Transfer Learning for Conversational Tasks using Prompt-Tuning Lifu Tu Jin Qu Semih Yavuz Shafiq R. Joty Wenhao Liu Caiming Xiong Yingbo Zhou 11 7 0 03 Apr 2023
RPTQ: Reorder-based Post-training Quantization for Large Language Models Zhihang Yuan Lin Niu Jia-Wen Liu Wenyu Liu Xinggang Wang Yuzhang Shang Guangyu Sun Qiang Wu Jiaxiang Wu Bingzhe Wu MQ 25 76 0 03 Apr 2023
LLMMaps -- A Visual Metaphor for Stratified Evaluation of Large Language Models Patrik Puchert Poonam Poonam Christian van Onzenoodt Timo Ropinski 13 8 0 02 Apr 2023
Evaluating Large Language Models on a Highly-specialized Topic, Radiation Oncology Physics J. Holmes Zheng Liu Lian-Cheng Zhang Yuzhen Ding Terence T. Sio ... Jonathan B. Ashman Xiang Li Tianming Liu Jiajian Shen W. Liu LM&MA AI4CE ELM 28 120 0 01 Apr 2023
CQSumDP: A ChatGPT-Annotated Resource for Query-Focused Abstractive Summarization Based on Debatepedia Md Tahmid Rahman Laskar Mizanur Rahman Israt Jahan Enamul Hoque J. Huang 17 8 0 31 Mar 2023
Evaluating GPT-4 and ChatGPT on Japanese Medical Licensing Examinations Jungo Kasai Y. Kasai Keisuke Sakaguchi Yutaro Yamada Dragomir R. Radev LM&MA ELM 22 99 0 31 Mar 2023
Evaluating GPT-3.5 and GPT-4 Models on Brazilian University Admission Exams Desnes Nunes Ricardo Primi Ramon Pires R. Lotufo Rodrigo Nogueira ELM 13 33 0 29 Mar 2023
Scaling Down to Scale Up: A Guide to Parameter-Efficient Fine-Tuning Vladislav Lialin Vijeta Deshpande Anna Rumshisky 15 167 0 28 Mar 2023
ChatGPT as a Factual Inconsistency Evaluator for Text Summarization Zheheng Luo Qianqian Xie Sophia Ananiadou ELM HILM ALM 25 73 0 27 Mar 2023
Typhoon: Towards an Effective Task-Specific Masking Strategy for Pre-trained Language Models Muhammed Shahir Abdurrahman Hashem Elezabi B. Xu 6 0 0 27 Mar 2023
Unlocking the Potential of ChatGPT: A Comprehensive Exploration of its Applications, Advantages, Limitations, and Future Directions in Natural Language Processing Walid Hariri AI4MH LM&MA 25 84 0 27 Mar 2023
Exploring the Impact of Instruction Data Scaling on Large Language Models: An Empirical Study on Real-World Use Cases Yunjie Ji Yong Deng Yan Gong Yiping Peng Qiang Niu L. Zhang Baochang Ma Xiangang Li ALM 19 93 0 26 Mar 2023
Prompting Multilingual Large Language Models to Generate Code-Mixed Texts: The Case of South East Asian Languages Zheng-Xin Yong Ruochen Zhang Jessica Zosa Forde Skyler Wang Arjun Subramonian ... Yinghua Tan Long Phan Rowena Garcia Thamar Solorio Alham Fikri Aji LRM 49 46 0 23 Mar 2023
Fairness-guided Few-shot Prompting for Large Language Models Huan Ma Changqing Zhang Yatao Bian Lemao Liu Zhirui Zhang P. Zhao Shu Zhen Zhang H. Fu Qinghua Hu Bing Wu LLMAG LRM 27 36 0 23 Mar 2023
MEGA: Multilingual Evaluation of Generative AI Kabir Ahuja Harshita Diddee Rishav Hada Millicent Ochieng Krithika Ramesh ... T. Ganu Sameer Segal Maxamed Axmed Kalika Bali Sunayana Sitaram LM&MA LRM ELM 19 264 0 22 Mar 2023
Fundamentals of Generative Large Language Models and Perspectives in Cyber-Defense Andrei Kucharavy Z. Schillaci Loic Maréchal Maxime Wursch Ljiljana Dolamic Remi Sabonnadiere Dimitri Percia David Alain Mermoud Vincent Lenders ELM AI4CE 22 31 0 21 Mar 2023
Large AI Models in Health Informatics: Applications, Challenges, and the Future Jianing Qiu Lin Li Jiankai Sun Jiachuan Peng Peilun Shi ... Bo Xiao Wu Yuan Ningli Wang Dong Xu Benny P. L. Lo AI4MH LM&MA 38 125 0 21 Mar 2023
eP-ALM: Efficient Perceptual Augmentation of Language Models Mustafa Shukor Corentin Dancette Matthieu Cord MLLM VLM 24 29 0 20 Mar 2023
DeID-GPT: Zero-shot Medical Text De-Identification by GPT-4 Zheng-Long Liu Yue Huang Xiao-Xing Yu Lu Zhang Zihao Wu ... Dinggang Shen Quanzheng Li Tianming Liu Dajiang Zhu Xiang Li LM&MA MedIm 21 168 0 20 Mar 2023
PanGu-Σ: Towards Trillion Parameter Language Model with Sparse Heterogeneous Computing Xiaozhe Ren Pingyi Zhou Xinfan Meng Xinjing Huang Yadao Wang ... Jiansheng Wei Xin Jiang Teng Su Qun Liu Jun Yao ALM MoE 67 60 0 20 Mar 2023
LP-SLAM: Language-Perceptive RGB-D SLAM system based on Large Language Model Weiyi Zhang Yushi Guo L. Niu Peijun Li Chun Zhang Zeyu Wan Jiaxiang Yan F. Farrukh Debing Zhang 11 6 0 17 Mar 2023
DeltaScore: Fine-Grained Story Evaluation with Perturbations Zhuohan Xie Miao Li Trevor Cohn Jey Han Lau 30 7 0 15 Mar 2023
UPRISE: Universal Prompt Retrieval for Improving Zero-Shot Evaluation Daixuan Cheng Shaohan Huang Junyu Bi Yu-Wei Zhan Jianfeng Liu Yujing Wang Hao-Lun Sun Furu Wei Denvy Deng Qi Zhang RALM LRM 19 67 0 15 Mar 2023
ZeroQuant-V2: Exploring Post-training Quantization in LLMs from Comprehensive Study to Low Rank Compensation Z. Yao Xiaoxia Wu Cheng-rong Li Stephen Youn Yuxiong He MQ 63 57 0 15 Mar 2023
Eliciting Latent Predictions from Transformers with the Tuned Lens Nora Belrose Zach Furman Logan Smith Danny Halawi Igor V. Ostrovsky Lev McKinney Stella Biderman Jacob Steinhardt 11 192 0 14 Mar 2023
The Life Cycle of Knowledge in Big Language Models: A Survey Boxi Cao Hongyu Lin Xianpei Han Le Sun KELM 26 27 0 14 Mar 2023
Exploring ChatGPT's Ability to Rank Content: A Preliminary Study on Consistency with Human Preferences Yunjie Ji Yan Gong Yiping Peng Chao Ni Peiyan Sun Dongyu Pan Baochang Ma Xiangang Li ELM ALM AI4MH 17 37 0 14 Mar 2023
FlexGen: High-Throughput Generative Inference of Large Language Models with a Single GPU Ying Sheng Lianmin Zheng Binhang Yuan Zhuohan Li Max Ryabinin ... Joseph E. Gonzalez Percy Liang Christopher Ré Ion Stoica Ce Zhang 144 366 0 13 Mar 2023
Multimodal Data Integration for Oncology in the Era of Deep Neural Networks: A Review Asim Waqas Aakash Tripathi Ravichandran Ramachandran Paul Stewart Ghulam Rasool AI4CE 32 31 0 11 Mar 2023
nl2spec: Interactively Translating Unstructured Natural Language to Temporal Logics with Large Language Models Matthias Cosler Christopher Hahn Daniel Mendoza Frederik Schmitt Caroline Trippel 19 55 0 08 Mar 2023
Extending the Pre-Training of BLOOM for Improved Support of Traditional Chinese: Models, Methods and Results Philipp Ennen Po-Chun Hsu Chan-Jan Hsu Chang-Le Liu Yen-Chen Wu Yin-Hsiang Liao Chin-Tung Lin Da-shan Shiu Wei-Yun Ma OSLM VLM AI4CE 28 10 0 08 Mar 2023
Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models Chenfei Wu Sheng-Kai Yin Weizhen Qi Xiaodong Wang Zecheng Tang Nan Duan MLLM LRM 39 613 0 08 Mar 2023