Calibrating the Confidence of Large Language Models by Eliciting
Fidelity

Calibrating the Confidence of Large Language Models by Eliciting Fidelity

3 April 2024

Xipeng Qiu

Papers citing "Calibrating the Confidence of Large Language Models by Eliciting Fidelity"

13 / 13 papers shown

Title
What do Language Model Probabilities Represent? From Distribution Estimation to Response Prediction Eitan Wagner Omri Abend 29 0 0 04 May 2025
Comparing Uncertainty Measurement and Mitigation Methods for Large Language Models: A Systematic Review Toghrul Abbasli Kentaroh Toyoda Yuan Wang Leon Witt Muhammad Asif Ali Yukai Miao Dan Li Qingsong Wei UQCV 85 0 0 25 Apr 2025
Generalization Bias in Large Language Model Summarization of Scientific Research Uwe Peters Benjamin Chin-Yee ELM 34 0 0 28 Mar 2025
DAWN-ICL: Strategic Planning of Problem-solving Trajectories for Zero-Shot In-Context Learning Xinyu Tang Xiaolei Wang Wayne Xin Zhao Ji-Rong Wen 43 3 0 26 Oct 2024
TuringQ: Benchmarking AI Comprehension in Theory of Computation Pardis Sadat Zahraei Ehsaneddin Asgari ELM LRM 16 0 0 09 Oct 2024
Showing LLM-Generated Code Selectively Based on Confidence of LLMs Jia Li Yuqi Zhu Yongmin Li Ge Li Zhi Jin 26 0 0 04 Oct 2024
Benchmarking Large Language Model Uncertainty for Prompt Optimization Pei-Fu Guo Yun-Da Tsai Shou-De Lin ELM LRM 16 1 0 16 Sep 2024
1+1>2: Can Large Language Models Serve as Cross-Lingual Knowledge Aggregators? Yue Huang Chenrui Fan Yuan Li Siyuan Wu Tianyi Zhou Xiangliang Zhang Lichao Sun 53 3 0 20 Jun 2024
Counterfactual Debating with Preset Stances for Hallucination Elimination of LLMs Yi Fang Moxin Li Wenjie Wang Hui Lin Fuli Feng LRM 54 5 0 17 Jun 2024
Think Twice Before Trusting: Self-Detection for Large Language Models through Comprehensive Answer Reflection Moxin Li Wenjie Wang Fuli Feng Fengbin Zhu Qifan Wang Tat-Seng Chua HILM LRM 33 8 0 15 Mar 2024
Investigating Uncertainty Calibration of Aligned Language Models under the Multiple-Choice Setting Guande He Peng Cui Jianfei Chen Wenbo Hu Jun Zhu 45 11 0 18 Oct 2023
Sparks of Artificial General Intelligence: Early experiments with GPT-4 Sébastien Bubeck Varun Chandrasekaran Ronen Eldan J. Gehrke Eric Horvitz ... Scott M. Lundberg Harsha Nori Hamid Palangi Marco Tulio Ribeiro Yi Zhang ELM AI4MH AI4CE ALM 233 2,232 0 22 Mar 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 303 11,881 0 04 Mar 2022