Title
Effective Large Language Model Adaptation for Improved Grounding and Citation Generation Xi Ye Ruoxi Sun Sercan O. Arik Tomas Pfister HILM 358 38 0 16 Nov 2023
AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation Haoyi Qiu Kung-Hsiang Huang Jingnong Qu Nanyun Peng HILM 259 12 0 16 Nov 2023
ARES: An Automated Evaluation Framework for Retrieval-Augmented Generation SystemsNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023 Jon Saad-Falcon Omar Khattab Christopher Potts Matei A. Zaharia RALM 432 186 0 16 Nov 2023
Ever: Mitigating Hallucination in Large Language Models through Real-Time Verification and Rectification Haoqiang Kang Juntong Ni Huaxiu Yao HILM LRM 339 45 0 15 Nov 2023
How Well Do Large Language Models Truly Ground?North American Chapter of the Association for Computational Linguistics (NAACL), 2023 Hyunji Lee Se June Joo Chaeeun Kim Joel Jang Doyoung Kim Kyoung-Woon On Minjoon Seo HILM 217 15 0 15 Nov 2023
Factcheck-Bench: Fine-Grained Evaluation Benchmark for Automatic Fact-checkersConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Yuxia Wang Revanth Gangi Reddy Zain Muhammad Mujahid Arnav Arora Aleksandr Rubashevskii ... Nadav Borenstein Aditya Pillai Isabelle Augenstein Iryna Gurevych Preslav Nakov HILM 497 60 0 15 Nov 2023
Fine-tuning Language Models for FactualityInternational Conference on Learning Representations (ICLR), 2023 Katherine Tian Eric Mitchell Huaxiu Yao Christopher D. Manning Chelsea Finn KELM HILM SyDa 239 236 0 14 Nov 2023
Extrinsically-Focused Evaluation of Omissions in Medical Summarization Elliot Schumacher Daniel Rosenthal Varun Nair Luladay Price Geoffrey Tso Anitha Kannan 160 2 0 14 Nov 2023
LLatrieval: LLM-Verified Retrieval for Verifiable GenerationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023 Xiaonan Li Changtai Zhu Linyang Li Zhangyue Yin Tianxiang Sun Xipeng Qiu RALM 234 48 0 14 Nov 2023
A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions Lei Huang Weijiang Yu Weitao Ma Weihong Zhong Zhangyin Feng ... Qianglong Chen Weihua Peng Xiaocheng Feng Bing Qin Ting Liu LRM HILM 338 1,778 0 09 Nov 2023
SEMQA: Semi-Extractive Multi-Source Question Answering Tal Schuster Á. Lelkes Haitian Sun Jai Gupta Jonathan Berant W. Cohen Donald Metzler 181 22 0 08 Nov 2023
Sub-Sentence Encoder: Contrastive Learning of Propositional Semantic Representations Sihao Chen Hongming Zhang Tong Chen Ben Zhou Wenhao Yu Dian Yu Baolin Peng Hongwei Wang Dan Roth Dong Yu SSL 219 19 0 07 Nov 2023
A Survey of Large Language Models Attribution Dongfang Li Zetian Sun Xinshuo Hu Zhenyu Liu Ziyang Chen Baotian Hu Aiguo Wu Min Zhang HILM 231 71 0 07 Nov 2023
FAITHSCORE: Evaluating Hallucinations in Large Vision-Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Liqiang Jing Ruosen Li Yunmo Chen Mengzhao Jia Xinya Du MLLM 277 18 0 02 Nov 2023
LitCab: Lightweight Language Model Calibration over Short- and Long-form ResponsesInternational Conference on Learning Representations (ICLR), 2023 Xin Liu Muhammad Khalifa Lu Wang ALM 205 31 0 30 Oct 2023
Davidsonian Scene Graph: Improving Reliability in Fine-grained Evaluation for Text-to-Image GenerationInternational Conference on Learning Representations (ICLR), 2023 Jaemin Cho Yushi Hu Roopal Garg Peter Anderson Ranjay Krishna Jason Baldridge Mohit Bansal Jordi Pont-Tuset Su Wang EGVM 277 118 0 27 Oct 2023
Language Models Hallucinate, but May Excel at Fact VerificationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023 Jian Guan Jesse Dodge Aman Rangapur Shiyu Huang Hao Peng LRM HILM 309 48 0 23 Oct 2023
Large Language Models Help Humans Verify Truthfulness -- Except When They Are Convincingly WrongNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023 Chenglei Si Navita Goyal Sherry Tongshuang Wu Chen Zhao Shi Feng Hal Daumé Jordan L. Boyd-Graber LRM 358 57 0 19 Oct 2023
Quantifying Self-diagnostic Atomic Knowledge in Chinese Medical Foundation Model: A Computational Analysis Yaxin Fan Feng Jiang Benyou Wang Peifeng Li Haizhou Li 244 2 0 18 Oct 2023
Understanding Retrieval Augmentation for Long-Form Question Answering Hung-Ting Chen Fangyuan Xu Shane Arora Eunsol Choi RALM 121 44 0 18 Oct 2023
Self-RAG: Learning to Retrieve, Generate, and Critique through Self-ReflectionInternational Conference on Learning Representations (ICLR), 2023 Akari Asai Zeqiu Wu Yizhong Wang Avirup Sil Hannaneh Hajishirzi RALM 561 1,234 0 17 Oct 2023
KGQuiz: Evaluating the Generalization of Encoded Knowledge in Large Language Models Yuyang Bai Shangbin Feng Vidhisha Balachandran Zhaoxuan Tan Shiqi Lou Tianxing He Yulia Tsvetkov ELM 220 5 0 15 Oct 2023
KCTS: Knowledge-Constrained Tree Search Decoding with Token-Level Hallucination DetectionConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Sehyun Choi Tianqing Fang Zhaowei Wang Yangqiu Song 182 52 0 13 Oct 2023
Prometheus: Inducing Fine-grained Evaluation Capability in Language ModelsInternational Conference on Learning Representations (ICLR), 2023 Seungone Kim Jamin Shin Yejin Cho Joel Jang Shayne Longpre ... Sangdoo Yun Seongjin Shin Sungdong Kim James Thorne Minjoon Seo ALM LM&MA ELM 429 352 0 12 Oct 2023
Survey on Factuality in Large Language Models: Knowledge, Retrieval and Domain-Specificity Cunxiang Wang Xiaoze Liu Yuanhao Yue Xiangru Tang Tianhang Zhang ... Linyi Yang Yongfeng Zhang Xing Xie Zheng Zhang Yue Zhang HILM KELM 383 248 0 11 Oct 2023
Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge GeneratorsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Liang Chen Yang Deng Yatao Bian Zeyu Qin Bingzhe Wu Tat-Seng Chua Kam-Fai Wong HILM ELM 199 62 0 11 Oct 2023
Teaching Language Models to Hallucinate Less with Synthetic TasksInternational Conference on Learning Representations (ICLR), 2023 Erik Jones Hamid Palangi Clarisse Simoes Varun Chandrasekaran Subhabrata Mukherjee Arindam Mitra Ahmed Hassan Awadallah Ece Kamar HILM 320 38 0 10 Oct 2023
Factuality Challenges in the Era of Large Language Models Isabelle Augenstein Timothy Baldwin Meeyoung Cha Tanmoy Chakraborty Giovanni Luca Ciampaglia ... Rubén Míguez Preslav Nakov Dietram A. Scheufele Shivam Sharma Giovanni Zagni HILM 301 52 0 08 Oct 2023
Knowledge Crosswords: Geometric Knowledge Reasoning with Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023 Wenxuan Ding Shangbin Feng Yuhan Liu Zhaoxuan Tan Vidhisha Balachandran Tianxing He Yulia Tsvetkov LRM 149 8 0 02 Oct 2023
BooookScore: A systematic exploration of book-length summarization in the era of LLMsInternational Conference on Learning Representations (ICLR), 2023 Yapei Chang Kyle Lo Tanya Goyal Mohit Iyyer ALM 349 151 0 01 Oct 2023
FELM: Benchmarking Factuality Evaluation of Large Language ModelsNeural Information Processing Systems (NeurIPS), 2023 Shiqi Chen Yiran Zhao Jinghan Zhang Ethan Chern Siyang Gao Pengfei Liu Junxian He HILM 363 60 0 01 Oct 2023
STRONG -- Structure Controllable Legal Opinion Summary GenerationInternational Joint Conference on Natural Language Processing (IJCNLP), 2023 Yang Zhong Diane Litman ELM AILaw 150 4 0 29 Sep 2023
Creating Trustworthy LLMs: Dealing with Hallucinations in Healthcare AI Muhammad Aurangzeb Ahmad Ilker Yaramis Taposh Dutta Roy LM&MA HILM 135 57 0 26 Sep 2023
Attention Satisfies: A Constraint-Satisfaction Lens on Factual Errors of Language ModelsInternational Conference on Learning Representations (ICLR), 2023 Mert Yuksekgonul Varun Chandrasekaran Erik Jones Suriya Gunasekar Ranjita Naik Hamid Palangi Ece Kamar Besmira Nushi HILM 172 65 0 26 Sep 2023
Large Language Model Alignment: A Survey Shangda Wu Renren Jin Yufei Huang Chuang Liu Weilong Dong Zishan Guo Xinwei Wu Yan Liu Deyi Xiong LM&MA 320 273 0 26 Sep 2023
Ragas: Automated Evaluation of Retrieval Augmented GenerationConference of the European Chapter of the Association for Computational Linguistics (EACL), 2023 ES Shahul Jithin James Luis Espinosa-Anke Steven Schockaert 444 367 0 26 Sep 2023
Calibrating LLM-Based EvaluatorInternational Conference on Language Resources and Evaluation (LREC), 2023 Yuxuan Liu Tianchi Yang Shaohan Huang Zihan Zhang Haizhen Huang Furu Wei Weiwei Deng Feng Sun Qi Zhang 252 43 0 23 Sep 2023
LongDocFACTScore: Evaluating the Factuality of Long Document Abstractive SummarisationInternational Conference on Language Resources and Evaluation (LREC), 2023 Jennifer A Bishop Qianqian Xie Sophia Ananiadou HILM 225 17 0 21 Sep 2023
Chain-of-Verification Reduces Hallucination in Large Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2023 Shehzaad Dhuliawala M. Komeili Jing Xu Roberta Raileanu Xian Li Asli Celikyilmaz Jason Weston LRM HILM 267 309 0 20 Sep 2023
Exploring the impact of low-rank adaptation on the performance, efficiency, and regularization of RLHF Simeng Sun Dhawal Gupta Mohit Iyyer 180 22 0 16 Sep 2023
ExpertQA: Expert-Curated Questions and Attributed AnswersNorth American Chapter of the Association for Computational Linguistics (NAACL), 2023 Chaitanya Malaviya Subin Lee Sihao Chen Elizabeth Sieber Mark Yatskar Dan Roth ELM HILM 342 83 0 14 Sep 2023
Zero-shot Audio Topic Reranking using Large Language ModelsSpoken Language Technology Workshop (SLT), 2023 Mengjie Qian Rao Ma Adian Liusie Erfan Loweimi Kate Knill Mark Gales 187 1 0 14 Sep 2023
Cognitive Mirage: A Review of Hallucinations in Large Language Models Hongbin Ye Tong Liu Aijia Zhang Wei Hua Weiqiang Jia HILM 329 110 0 13 Sep 2023
Retrieving Evidence from EHRs with LLMs: Possibilities and ChallengesACM Conference on Health, Inference, and Learning (CHIL), 2023 Hiba Ahsan Denis Jered McInerney Jisoo Kim Christopher Potter Geoffrey S. Young Silvio Amir Byron C. Wallace 209 21 0 08 Sep 2023
Zero-Resource Hallucination Prevention for Large Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023 Junyu Luo Cao Xiao Fenglong Ma HILM 408 33 0 06 Sep 2023
Siren's Song in the AI Ocean: A Survey on Hallucination in Large Language ModelsComputational Linguistics (CL), 2023 Yue Zhang Yafu Li Leyang Cui Deng Cai Lemao Liu ... Longyue Wang Anh Tuan Luu Freda Shi Shuming Shi Shuming Shi LRM RALM HILM 626 780 0 03 Sep 2023
Halo: Estimation and Reduction of Hallucinations in Open-Source Weak Large Language Models Mohamed S. Elaraby Mengyin Lu Jacob Dunn Xueying Zhang Yu Wang Shizhu Liu Pingchuan Tian Yuping Wang Yuxuan Wang HILM 269 41 0 22 Aug 2023
Answering Unseen Questions With Smaller Language Models Using Rationale Generation and Dense Retrieval Tim Hartill Diana Benavides-Prado Michael Witbrock Patricia J. Riddle ReLM LRM 156 3 0 09 Aug 2023
Automatically Correcting Large Language Models: Surveying the landscape of diverse self-correction strategies Liangming Pan Michael Stephen Saxon Wenda Xu Deepak Nathani Xinyi Wang William Yang Wang KELM LRM 331 262 0 06 Aug 2023
On the Trustworthiness Landscape of State-of-the-art Generative Models: A Survey and OutlookInternational Journal of Computer Vision (IJCV), 2023 Mingyuan Fan Chengyu Wang Cen Chen Yang Liu Jun Huang HILM 243 10 0 31 Jul 2023