Bias in Bios: A Case Study of Semantic Representation Bias in a High-Stakes Setting

27 January 2019

Alexandra Chouldechova

S. Geyik

K. Kenthapadi

Adam Tauman Kalai

ArXiv PDF HTML

Papers citing "Bias in Bios: A Case Study of Semantic Representation Bias in a High-Stakes Setting"

50 / 111 papers shown

Title
Fair Text Classification via Transferable Representations Thibaud Leteno Michael Perrot Charlotte Laclau Antoine Gourru Christophe Gravier FaML 93 0 0 10 Mar 2025
Gender Encoding Patterns in Pretrained Language Model Representations Mahdi Zakizadeh Mohammad Taher Pilehvar 56 0 0 09 Mar 2025
Conformal Prediction Sets Can Cause Disparate Impact Jesse C. Cresswell Bhargava Kumar Yi Sui Mouloud Belbahri FaML 92 1 0 17 Feb 2025
Foundation Models at Work: Fine-Tuning for Fairness in Algorithmic Hiring Buse Sibel Korkmaz Rahul Nair Elizabeth M. Daly Evangelos Anagnostopoulos Christos Varytimidis Antonio del Rio Chanona 45 0 0 13 Jan 2025
ConSim: Measuring Concept-Based Explanations' Effectiveness with Automated Simulatability Antonin Poché Alon Jacovi Agustin Picard Victor Boutin Fanny Jourdan 47 2 0 10 Jan 2025
Natural Language Processing for Human Resources: A Survey Naoki Otani Nikita Bhutani Estevam R. Hruschka VLM 44 0 0 21 Oct 2024
A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks Hoin Jung T. Jang Xiaoqian Wang VLM 29 2 0 10 Oct 2024
Collapsed Language Models Promote Fairness Jingxuan Xu Wuyang Chen Linyi Li Yao Zhao Yunchao Wei 51 0 0 06 Oct 2024
Fair Class-Incremental Learning using Sample Weighting Jaeyoung Park Minsu Kim Steven Euijong Whang 38 0 0 02 Oct 2024
Mitigating Propensity Bias of Large Language Models for Recommender Systems Guixian Zhang Guan Yuan Debo Cheng Lin Liu Jiuyong Li Shichao Zhang 49 2 0 30 Sep 2024
Does Liking Yellow Imply Driving a School Bus? Semantic Leakage in Language Models Hila Gonen Terra Blevins Alisa Liu Luke Zettlemoyer Noah A. Smith 36 5 0 12 Aug 2024
On Behalf of the Stakeholders: Trends in NLP Model Interpretability in the Era of LLMs Nitay Calderon Roi Reichart 47 13 0 27 Jul 2024
Balancing the Scales: Reinforcement Learning for Fair Classification Leon Eshuijs Shihan Wang Antske Fokkens FaML 32 0 0 15 Jul 2024
$GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models via Counterfactual Probing$ GenderBias-\emph{VL}: Benchmarking Gender Bias in Vision Language Models via Counterfactual Probing Yisong Xiao Aishan Liu QianJia Cheng Zhenfei Yin Siyuan Liang Jiapeng Li Jing Shao Xianglong Liu Dacheng Tao 66 4 0 30 Jun 2024
Evaluating Human Alignment and Model Faithfulness of LLM Rationale Mohsen Fayyaz Fan Yin Jiao Sun Nanyun Peng 70 3 0 28 Jun 2024
Evaluating Short-Term Temporal Fluctuations of Social Biases in Social Media Data and Masked Language Models Yi Zhou Danushka Bollegala Jose Camacho-Collados 49 1 0 19 Jun 2024
Towards Understanding Task-agnostic Debiasing Through the Lenses of Intrinsic Bias and Forgetfulness Guangliang Liu Milad Afshari Xitong Zhang Zhiyu Xue Avrajit Ghosh Bidhan Bashyal Rongrong Wang K. Johnson 32 0 0 06 Jun 2024
The Trade-off between Performance, Efficiency, and Fairness in Adapter Modules for Text Classification Minh Duc Bui K. Wense 40 0 0 03 May 2024
The Impact of Unstated Norms in Bias Analysis of Language Models Farnaz Kohankhaki D. B. Emerson David B. Emerson Laleh Seyyed-Kalantari Faiza Khan Khattak 62 1 0 04 Apr 2024
Sparse Feature Circuits: Discovering and Editing Interpretable Causal Graphs in Language Models Samuel Marks Can Rager Eric J. Michaud Yonatan Belinkov David Bau Aaron Mueller 53 122 0 28 Mar 2024
Bias in Language Models: Beyond Trick Tests and Toward RUTEd Evaluation Kristian Lum Jacy Reese Anthis Chirag Nagpal Alex DÁmour Alexander D’Amour 33 14 0 20 Feb 2024
JAB: Joint Adversarial Prompting and Belief Augmentation Ninareh Mehrabi Palash Goyal Anil Ramakrishna Jwala Dhamala Shalini Ghosh Richard Zemel Kai-Wei Chang Aram Galstyan Rahul Gupta AAML 41 7 0 16 Nov 2023
"Kelly is a Warm Person, Joseph is a Role Model": Gender Biases in LLM-Generated Reference Letters Yixin Wan George Pu Jiao Sun Aparna Garimella Kai-Wei Chang Nanyun Peng 46 165 0 13 Oct 2023
OpinionGPT: Modelling Explicit Biases in Instruction-Tuned LLMs Patrick Haller Ansar Aynetdinov Alan Akbik 38 24 0 07 Sep 2023
Thesis Distillation: Investigating The Impact of Bias in NLP Models on Hate Speech Detection Fatma Elsafoury 31 3 0 31 Aug 2023
A Survey on Fairness in Large Language Models Yingji Li Mengnan Du Rui Song Xin Wang Ying Wang ALM 57 61 0 20 Aug 2023
Prompt Tuning Pushes Farther, Contrastive Learning Pulls Closer: A Two-Stage Approach to Mitigate Social Biases Yingji Li Mengnan Du Xin Wang Ying Wang 60 27 0 04 Jul 2023
LEACE: Perfect linear concept erasure in closed form Nora Belrose David Schneider-Joseph Shauli Ravfogel Ryan Cotterell Edward Raff Stella Biderman KELM MU 43 103 0 06 Jun 2023
Benchmarking Robustness of Adaptation Methods on Pre-trained Vision-Language Models Shuo Chen Jindong Gu Zhen Han Yunpu Ma Philip Torr Volker Tresp VPVLM VLM 45 17 0 03 Jun 2023
Should We Attend More or Less? Modulating Attention for Fairness A. Zayed Gonçalo Mordido Samira Shabanian Sarath Chandar 45 10 0 22 May 2023
Shielded Representations: Protecting Sensitive Attributes Through Iterative Gradient-Based Projection Shadi Iskander Kira Radinsky Yonatan Belinkov 51 17 0 17 May 2023
Surfacing Biases in Large Language Models using Contrastive Input Decoding G. Yona Or Honovich Itay Laish Roee Aharoni 29 11 0 12 May 2023
Fairness Evaluation in Text Classification: Machine Learning Practitioner Perspectives of Individual and Group Fairness Zahra Ashktorab Benjamin Hoover Mayank Agarwal Casey Dugan Werner Geyer Han Yang Mikhail Yurochkin FaML 43 17 0 01 Mar 2023
How optimal transport can tackle gender biases in multi-class neural-network classifiers for job recommendations? Fanny Jourdan Titon Tshiongo Kaninku Nicholas M. Asher Jean-Michel Loubes Laurent Risser FaML 30 4 0 27 Feb 2023
In-Depth Look at Word Filling Societal Bias Measures Matúš Pikuliak Ivana Benová Viktor Bachratý 34 9 0 24 Feb 2023
Human-Centric Multimodal Machine Learning: Recent Advances and Testbed on AI-based Recruitment Alejandro Peña Ignacio Serna Aythami Morales Julian Fierrez Alfonso Ortega Ainhoa Herrarte Manuel Alcántara J. Ortega-Garcia FaML 30 35 0 13 Feb 2023
Emerging Synergies in Causality and Deep Generative Models: A Survey Guanglin Zhou Shaoan Xie Guang-Yuan Hao Shiming Chen Erdun Gao Xiwei Xu Chen Wang Liming Zhu Lina Yao Kun Zhang AI4CE 57 11 0 29 Jan 2023
Understanding the Role of Human Intuition on Reliance in Human-AI Decision-Making with Explanations Valerie Chen Q. V. Liao Jennifer Wortman Vaughan Gagan Bansal 52 105 0 18 Jan 2023
JASMINE: Arabic GPT Models for Few-Shot Learning El Moatez Billah Nagoudi Muhammad Abdul-Mageed AbdelRahim Elmadany Alcides Alcoba Inciarte Md. Tawkat Islam Khondaker 38 7 0 21 Dec 2022
Better Hit the Nail on the Head than Beat around the Bush: Removing Protected Attributes with a Single Projection P. Haghighatkhah Antske Fokkens Pia Sommerauer Bettina Speckmann Kevin Verbeek 32 10 0 08 Dec 2022
Self-Destructing Models: Increasing the Costs of Harmful Dual Uses of Foundation Models Peter Henderson E. Mitchell Christopher D. Manning Dan Jurafsky Chelsea Finn 27 47 0 27 Nov 2022
Professional Presentation and Projected Power: A Case Study of Implicit Gender Information in English CVs Jinrui Yang Sheilla Njoto M. Cheong Leah Ruppanner Lea Frermann 11 4 0 17 Nov 2022
Easily Accessible Text-to-Image Generation Amplifies Demographic Stereotypes at Large Scale Federico Bianchi Pratyusha Kalluri Esin Durmus Faisal Ladhak Myra Cheng Debora Nozza Tatsunori Hashimoto Dan Jurafsky James Zou Aylin Caliskan DiffM VLM 41 291 0 07 Nov 2022
Choose Your Lenses: Flaws in Gender Bias Evaluation Hadas Orgad Yonatan Belinkov 32 35 0 20 Oct 2022
The Tail Wagging the Dog: Dataset Construction Biases of Social Bias Benchmarks Nikil Selvam Sunipa Dev Daniel Khashabi Tushar Khot Kai-Wei Chang ALM 29 25 0 18 Oct 2022
Log-linear Guardedness and its Implications Shauli Ravfogel Yoav Goldberg Ryan Cotterell 35 2 0 18 Oct 2022
Machine Learning in Transaction Monitoring: The Prospect of xAI Julie Gerlings Ioanna D. Constantiou 17 2 0 14 Oct 2022
Controlling Bias Exposure for Fair Interpretable Predictions Zexue He Yu Wang Julian McAuley Bodhisattwa Prasad Majumder 27 19 0 14 Oct 2022
Back to the Future: On Potential Histories in NLP Zeerak Talat Anne Lauscher AI4TS 35 4 0 12 Oct 2022
HumSet: Dataset of Multilingual Information Extraction and Classification for Humanitarian Crisis Response Selim Fekih Nicolò Tamagnone Benjamin Minixhofer R. Shrestha Ximena Contla Ewan Oglethorpe Navid Rekabsaz 21 6 0 10 Oct 2022