Enhancing Chat Language Models by Scaling High-quality Instructional Conversations

23 May 2023

Zhiyuan Liu

Maosong Sun

Bowen Zhou

ALM

ArXiv PDF HTML

Papers citing "Enhancing Chat Language Models by Scaling High-quality Instructional Conversations"

50 / 376 papers shown

Title
Self-calibration for Language Model Quantization and Pruning Miles Williams G. Chrysostomou Nikolaos Aletras MQ 45 0 0 22 Oct 2024
Pre-training Distillation for Large Language Models: A Design Space Exploration Hao Peng Xin Lv Yushi Bai Zijun Yao J. Zhang Lei Hou Juanzi Li 23 3 0 21 Oct 2024
Griffon-G: Bridging Vision-Language and Vision-Centric Tasks via Large Multimodal Models Yufei Zhan Hongyin Zhao Yousong Zhu Fan Yang Ming Tang Jinqiao Wang MLLM 43 1 0 21 Oct 2024
Bridging the Training-Inference Gap in LLMs by Leveraging Self-Generated Tokens Zhepeng Cen Yao Liu Siliang Zeng Pratik Chaudhar Huzefa Rangwala George Karypis Rasool Fakoor SyDa AIFin 16 3 0 18 Oct 2024
DFlow: Diverse Dialogue Flow Simulation with Large Language Models Wanyu Du Song Feng James Gung Lijia Sun Yi Zhang Saab Mansour Yanjun Qi 45 0 0 18 Oct 2024
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs Sumanth Doddapaneni Mohammed Safi Ur Rahman Khan Dilip Venkatesh Raj Dabre Anoop Kunchukuttan Mitesh M. Khapra ELM 35 1 0 17 Oct 2024
Neuron-based Personality Trait Induction in Large Language Models Jia Deng Tianyi Tang Yanbin Yin Wenhao Yang Wayne Xin Zhao Ji-Rong Wen 29 1 0 16 Oct 2024
Semantics-Adaptive Activation Intervention for LLMs via Dynamic Steering Vectors Weixuan Wang J. Yang Wei Peng LLMSV 13 2 0 16 Oct 2024
HART: Efficient Visual Generation with Hybrid Autoregressive Transformer Haotian Tang Yecheng Wu Shang Yang Enze Xie Junsong Chen Junyu Chen Zhuoyang Zhang Han Cai Y. Lu Song Han 61 32 0 14 Oct 2024
Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations Litu Rout Yujia Chen Nataniel Ruiz C. Caramanis Sanjay Shakkottai Wen-Sheng Chu DiffM 59 23 0 14 Oct 2024
ControlMM: Controllable Masked Motion Generation Ekkasit Pinyoanuntapong Muhammad Usama Saleem Korrawe Karunratanakul Pu Wang Hongfei Xue C. L. P. Chen Chuan Guo Junli Cao J. Ren Sergey Tulyakov VGen 29 4 0 14 Oct 2024
Fast Convergence of $Φ$ -Divergence Along the Unadjusted Langevin Algorithm and Proximal Sampler Siddharth Mitra Andre Wibisono 44 16 0 14 Oct 2024
ACER: Automatic Language Model Context Extension via Retrieval Luyu Gao Yunyi Zhang Jamie Callan RALM 21 0 0 11 Oct 2024
Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning Shuhe Wang Guoyin Wang Y. Wang Jiwei Li Eduard H. Hovy Chen Guo 32 4 0 10 Oct 2024
StablePrompt: Automatic Prompt Tuning using Reinforcement Learning for Large Language Models Minchan Kwon Gaeun Kim Jongsuk Kim Haeil Lee Junmo Kim OffRL LRM LLMAG 16 1 0 10 Oct 2024
Evolutionary Contrastive Distillation for Language Model Alignment Julian Katz-Samuels Zheng Li Hyokun Yun Priyanka Nigam Yi Xu Vaclav Petricek Bing Yin Trishul M. Chilimbi ALM SyDa 16 0 0 10 Oct 2024
Self-Boosting Large Language Models with Synthetic Preference Data Qingxiu Dong Li Dong Xingxing Zhang Zhifang Sui Furu Wei SyDa 34 6 0 09 Oct 2024
Instructional Segment Embedding: Improving LLM Safety with Instruction Hierarchy Tong Wu Shujian Zhang Kaiqiang Song Silei Xu Sanqiang Zhao Ravi Agrawal Sathish Indurthi Chong Xiang Prateek Mittal Wenxuan Zhou 37 7 0 09 Oct 2024
DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback Zaid Khan Elias Stengel-Eskin Jaemin Cho Mohit Bansal VGen 36 1 0 08 Oct 2024
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe Yuxin Xiao Shujian Zhang Wenxuan Zhou Marzyeh Ghassemi Sanqiang Zhao 49 0 0 07 Oct 2024
MVP-Bench: Can Large Vision--Language Models Conduct Multi-level Visual Perception Like Humans? Guanzhen Li Yuxi Xie Min-Yen Kan VLM 27 2 0 06 Oct 2024
SwiftKV: Fast Prefill-Optimized Inference with Knowledge-Preserving Model Transformation Aurick Qiao Z. Yao Samyam Rajbhandari Yuxiong He VLM 24 0 0 04 Oct 2024
Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback Kyuyoung Kim Ah Jeong Seo Hao Liu Jinwoo Shin Kimin Lee 14 2 0 04 Oct 2024
Mixture of Attentions For Speculative Decoding Matthieu Zimmer Milan Gritta Gerasimos Lampouras Haitham Bou Ammar Jun Wang 71 4 0 04 Oct 2024
Better Instruction-Following Through Minimum Bayes Risk Ian Wu Patrick Fernandes Amanda Bertsch Seungone Kim Sina Pakazad Graham Neubig 48 9 0 03 Oct 2024
How to Train Long-Context Language Models (Effectively) Tianyu Gao Alexander Wettig Howard Yen Danqi Chen RALM 66 36 0 03 Oct 2024
FactAlign: Long-form Factuality Alignment of Large Language Models Chao-Wei Huang Yun-Nung Chen HILM 18 1 0 02 Oct 2024
DoPAMine: Domain-specific Pre-training Adaptation from seed-guided data Mining Vinayak Arannil Neha Narwal Sourav Sanjukta Bhabesh Sai Nikhil Thirandas Darren Yow-Bang Wang Graham Horwood Alex Anto Chirayath Gouri Pandeshwar 41 0 0 30 Sep 2024
The Perfect Blend: Redefining RLHF with Mixture of Judges Tengyu Xu Eryk Helenowski Karthik Abinav Sankararaman Di Jin Kaiyan Peng ... Gabriel Cohen Yuandong Tian Hao Ma Sinong Wang Han Fang 31 9 0 30 Sep 2024
Robust LLM safeguarding via refusal feature adversarial training L. Yu Virginie Do Karen Hambardzumyan Nicola Cancedda AAML 53 9 0 30 Sep 2024
AstroMLab 2: AstroLLaMA-2-70B Model and Benchmarking Specialised LLMs for Astronomy Rui Pan Tuan Dung Nguyen Hardik Arora Alberto Accomazzi Tirthankar Ghosal Yuan-Sen Ting 19 1 0 29 Sep 2024
Instruction Embedding: Latent Representations of Instructions Towards Task Identification Yiwei Li Jiayi Shi Shaoxiong Feng Peiwen Yuan Xinglin Wang Boyuan Pan Heda Wang Yao Hu Kan Li 18 1 0 29 Sep 2024
Holistic Automated Red Teaming for Large Language Models through Top-Down Test Case Generation and Multi-turn Interaction Jinchuan Zhang Yan Zhou Yaxin Liu Ziming Li Songlin Hu AAML 18 3 0 25 Sep 2024
MonoFormer: One Transformer for Both Diffusion and Autoregression Chuyang Zhao Yuxing Song Wenhao Wang Haocheng Feng Errui Ding Yifan Sun Xinyan Xiao Jingdong Wang DiffM 26 17 0 24 Sep 2024
Learning When to Retrieve, What to Rewrite, and How to Respond in Conversational QA Nirmal Roy Leonardo F. R. Ribeiro Rexhina Blloshmi Kevin Small RALM 17 1 0 23 Sep 2024
Beyond Fine-tuning: Unleashing the Potential of Continuous Pretraining for Clinical LLMs Clément Christophe Tathagata Raha Svetlana Maslenkova Muhammad Umar Salman Praveen K Kanithi Marco AF Pimentel Shadab Khan LM&MA 33 1 0 23 Sep 2024
Attack Atlas: A Practitioner's Perspective on Challenges and Pitfalls in Red Teaming GenAI Ambrish Rawat Stefan Schoepf Giulio Zizzo Giandomenico Cornacchia Muhammad Zaid Hameed ... Elizabeth M. Daly Mark Purcell P. Sattigeri Pin-Yu Chen Kush R. Varshney AAML 40 6 0 23 Sep 2024
Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning Jiaxin Wen Jian Guan Hongning Wang Wei Wu Minlie Huang ReLM OffRL LRM 26 7 0 19 Sep 2024
Multi-Document Grounded Multi-Turn Synthetic Dialog Generation Young-Suk Lee Chulaka Gunasekara Danish Contractor Ramón Fernandez Astudillo Radu Florian 17 1 0 17 Sep 2024
FP-VEC: Fingerprinting Large Language Models via Efficient Vector Addition Zhenhua Xu Wenpeng Xing Zhebo Wang Chang Hu Chen Jie Meng Han 23 1 0 13 Sep 2024
Synthetic continued pretraining Zitong Yang Neil Band Shuangping Li Emmanuel Candès Tatsunori Hashimoto CLL SyDa 36 11 0 11 Sep 2024
RNR: Teaching Large Language Models to Follow Roles and Rules Kuan-Chieh Jackson Wang Alexander Bukharin Haoming Jiang Qingyu Yin Zhengyang Wang ... Chao Zhang Bing Yin Xian Li Jianshu Chen Shiyang Li ALM 21 1 0 10 Sep 2024
LLaMA-Omni: Seamless Speech Interaction with Large Language Models Qingkai Fang Shoutao Guo Yan Zhou Zhengrui Ma Shaolei Zhang Yang Feng AuLLM 25 29 0 10 Sep 2024
Fast Forwarding Low-Rank Training Adir Rahamim Naomi Saphra Sara Kangaslahti Yonatan Belinkov 26 0 0 06 Sep 2024
Towards a Unified View of Preference Learning for Large Language Models: A Survey Bofei Gao Feifan Song Yibo Miao Zefan Cai Z. Yang ... Houfeng Wang Zhifang Sui Peiyi Wang Baobao Chang Baobao Chang 41 11 0 04 Sep 2024
Self-Judge: Selective Instruction Following with Alignment Self-Evaluation Hai Ye Hwee Tou Ng ELM ALM 25 4 0 02 Sep 2024
Inverse-Q*: Token Level Reinforcement Learning for Aligning Large Language Models Without Preference Data Han Xia Songyang Gao Qiming Ge Zhiheng Xi Qi Zhang Xuanjing Huang 36 4 0 27 Aug 2024
Bi-Factorial Preference Optimization: Balancing Safety-Helpfulness in Language Models Wenxuan Zhang Philip H. S. Torr Mohamed Elhoseiny Adel Bibi 48 9 0 27 Aug 2024
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models Junyao Ge Yang Zheng Kaitai Guo Jimin Liang Jimin Liang 27 1 0 27 Aug 2024
Selective Preference Optimization via Token-Level Reward Function Estimation Kailai Yang Zhiwei Liu Qianqian Xie Jimin Huang Erxue Min Sophia Ananiadou 28 10 0 24 Aug 2024