Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in
Large Language Models

Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in Large Language Models

6 June 2024

Papers citing "Ask LLMs Directly, "What shapes your bias?": Measuring Social Bias in Large Language Models"

10 / 10 papers shown

Title
Splits! A Flexible Dataset for Evaluating a Model's Demographic Social Inference Eylon Caplan Tania Chakraborty Dan Goldwasser 21 0 0 06 Apr 2025
The Mind in the Machine: A Survey of Incorporating Psychological Theories in LLMs Zizhou Liu Ziwei Gong Lin Ai Zheng Hui Run Chen Colin Wayne Leach Michelle R. Greene Julia Hirschberg LLMAG 57 0 0 28 Mar 2025
Implicit Priors Editing in Stable Diffusion via Targeted Token Adjustment Feng He Chao Zhang Zhixue Zhao 69 0 0 04 Dec 2024
Different Bias Under Different Criteria: Assessing Bias in LLMs with a Fact-Based Approach Changgeon Ko Jisu Shin Hoyun Song Jeongyeon Seo Jong C. Park 59 0 0 26 Nov 2024
A Roadmap to Pluralistic Alignment Taylor Sorensen Jared Moore Jillian R. Fisher Mitchell L. Gordon Niloofar Mireshghallah ... Liwei Jiang Ximing Lu Nouha Dziri Tim Althoff Yejin Choi 65 75 0 07 Feb 2024
Bias Runs Deep: Implicit Reasoning Biases in Persona-Assigned LLMs Shashank Gupta Vaishnavi Shrivastava A. Deshpande A. Kalyan Peter Clark Ashish Sabharwal Tushar Khot 120 49 0 08 Nov 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Can Machines Learn Morality? The Delphi Experiment Liwei Jiang Jena D. Hwang Chandra Bhagavatula Ronan Le Bras Jenny T Liang ... Yulia Tsvetkov Oren Etzioni Maarten Sap Regina A. Rini Yejin Choi FaML 114 110 0 14 Oct 2021
The Woman Worked as a Babysitter: On Biases in Language Generation Emily Sheng Kai-Wei Chang Premkumar Natarajan Nanyun Peng 204 607 0 03 Sep 2019
Towards A Rigorous Science of Interpretable Machine Learning Finale Doshi-Velez Been Kim XAI FaML 225 3,658 0 28 Feb 2017