How Reliable are Model Diagnostics?

12 May 2021

Papers citing "How Reliable are Model Diagnostics?"

18 / 18 papers shown

Title
From 'Showgirls' to 'Performers': Fine-tuning with Gender-inclusive Language for Bias Reduction in LLMs Marion Bartl Susan Leavy 35 8 0 05 Jul 2024
RuBia: A Russian Language Bias Detection Dataset Veronika Grigoreva Anastasiia Ivanova I. Alimova Ekaterina Artemova 30 1 0 26 Mar 2024
MAGPIE: Multi-Task Media-Bias Analysis Generalization for Pre-Trained Identification of Expressions Tomávs Horych Martin Wessel Jan Philip Wahle Terry Ruas Jerome Wassmuth André Greiner-Petter Akiko Aizawa Bela Gipp Timo Spinde 38 1 0 27 Feb 2024
Women Are Beautiful, Men Are Leaders: Gender Stereotypes in Machine Translation and Language Modeling Matúš Pikuliak Andrea Hrckova Stefan Oresko Marián Simko 18 5 0 30 Nov 2023
An Empirical Analysis of Parameter-Efficient Methods for Debiasing Pre-Trained Language Models Zhongbin Xie Thomas Lukasiewicz 19 12 0 06 Jun 2023
Trustworthy Social Bias Measurement Rishi Bommasani Percy Liang 27 10 0 20 Dec 2022
Evaluation for Change Rishi Bommasani ELM 35 0 0 20 Dec 2022
Undesirable Biases in NLP: Addressing Challenges of Measurement Oskar van der Wal Dominik Bachmann Alina Leidinger L. Maanen Willem H. Zuidema K. Schulz 17 6 0 24 Nov 2022
MABEL: Attenuating Gender Bias using Textual Entailment Data Jacqueline He Mengzhou Xia C. Fellbaum Danqi Chen 16 32 0 26 Oct 2022
On the data requirements of probing Zining Zhu Jixuan Wang Bai Li Frank Rudzicz 19 5 0 25 Feb 2022
An Empirical Survey of the Effectiveness of Debiasing Techniques for Pre-trained Language Models Nicholas Meade Elinor Poole-Dayan Siva Reddy 14 123 0 16 Oct 2021
The MultiBERTs: BERT Reproductions for Robustness Analysis Thibault Sellam Steve Yadlowsky Jason W. Wei Naomi Saphra Alexander DÁmour ... Iulia Turc Jacob Eisenstein Dipanjan Das Ian Tenney Ellie Pavlick 22 93 0 30 Jun 2021
StereoSet: Measuring stereotypical bias in pretrained language models Moin Nadeem Anna Bethke Siva Reddy 11 952 0 20 Apr 2020
Calibration of Pre-trained Transformers Shrey Desai Greg Durrett UQLM 243 289 0 17 Mar 2020
Investigating Multilingual NMT Representations at Scale Sneha Kudugunta Ankur Bapna Isaac Caswell N. Arivazhagan Orhan Firat LRM 136 120 0 05 Sep 2019
Language Models as Knowledge Bases? Fabio Petroni Tim Rocktaschel Patrick Lewis A. Bakhtin Yuxiang Wu Alexander H. Miller Sebastian Riedel KELM AI4MH 406 2,584 0 03 Sep 2019
What you can cram into a single vector: Probing sentence embeddings for linguistic properties Alexis Conneau Germán Kruszewski Guillaume Lample Loïc Barrault Marco Baroni 199 882 0 03 May 2018
GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding Alex Jinpeng Wang Amanpreet Singh Julian Michael Felix Hill Omer Levy Samuel R. Bowman ELM 294 6,943 0 20 Apr 2018