Directions in Abusive Language Training Data: Garbage In, Garbage Out

3 April 2020

Papers citing "Directions in Abusive Language Training Data: Garbage In, Garbage Out"

33 / 33 papers shown

Title
TikTok Search Recommendations: Governance and Research Challenges Taylor Annabell Robert Gorwa Rebecca Scharlach Jacob van de Kerkhof Thales Bertaglia 29 0 0 13 May 2025
Sentiment Analysis in SemEval: A Review of Sentiment Identification Approaches Bousselham EL HADDAOUI R. Chiheb R. Faizi A. E. Afia 49 0 0 13 Mar 2025
Monolingual and Multilingual Misinformation Detection for Low-Resource Languages: A Comprehensive Survey Xinyu Wang Wenbo Zhang Sarah Rajtmajer 29 1 0 24 Oct 2024
DefVerify: Do Hate Speech Models Reflect Their Dataset's Definition? Urja Khurana Eric T. Nalisnick Antske Fokkens 46 1 0 21 Oct 2024
From Languages to Geographies: Towards Evaluating Cultural Bias in Hate Speech Datasets Manuel Tonneau Diyi Liu Samuel Fraiberger Ralph Schroeder Scott A. Hale Paul Röttger 34 5 0 27 Apr 2024
HarmPot: An Annotation Framework for Evaluating Offline Harm Potential of Social Media Text Ritesh Kumar Ojaswee Bhalla Madhu Vanthi Shehlat Maknoon Wani Siddharth Singh 30 2 0 17 Mar 2024
Efficient Models for the Detection of Hate, Abuse and Profanity Christoph Tillmann Aashka Trivedi Bishwaranjan Bhattacharjee VLM 16 0 0 08 Feb 2024
Cross-lingual Offensive Language Detection: A Systematic Review of Datasets, Transfer Approaches and Challenges Aiqi Jiang A. Zubiaga AAML 31 3 0 17 Jan 2024
Enhancing Robustness of Foundation Model Representations under Provenance-related Distribution Shifts Xiruo Ding Zhecheng Sheng Brian Hur Feng Chen Serguei V. S. Pakhomov Trevor Cohen OOD 20 0 0 09 Dec 2023
The Skipped Beat: A Study of Sociopragmatic Understanding in LLMs for 64 Languages Chiyu Zhang Khai Duy Doan Qisheng Liao Muhammad Abdul-Mageed 36 6 0 23 Oct 2023
LCT-1 at SemEval-2023 Task 10: Pre-training and Multi-task Learning for Sexism Detection and Classification K. Chernyshev E. Garanina Duygu Bayram Qiankun Zheng Lukas Edman 11 0 0 08 Jun 2023
Changing Data Sources in the Age of Machine Learning for Official Statistics Cedric De Boom Michael Reusens 20 1 0 07 Jun 2023
Assessing Language Model Deployment with Risk Cards Leon Derczynski Hannah Rose Kirk Vidhisha Balachandran Sachin Kumar Yulia Tsvetkov M. Leiser Saif Mohammad 28 42 0 31 Mar 2023
SemEval-2023 Task 10: Explainable Detection of Online Sexism Hannah Rose Kirk Wenjie Yin Bertie Vidgen Paul Röttger 18 117 0 07 Mar 2023
CoRAL: a Context-aware Croatian Abusive Language Dataset Ravi Shekhar Mladen Karan Matthew Purver 38 5 0 11 Nov 2022
Human-Machine Collaboration Approaches to Build a Dialogue Dataset for Hate Speech Countering Helena Bonaldi Sara Dellantonio Serra Sinem Tekiroğlu Marco Guerini 23 41 0 07 Nov 2022
Data-Efficient Strategies for Expanding Hate Speech Detection into Under-Resourced Languages Paul Röttger Debora Nozza Federico Bianchi Dirk Hovy 29 10 0 20 Oct 2022
How Hate Speech Varies by Target Identity: A Computational Analysis Michael Miller Yoder Lynnette Hui Xian Ng D. W. Brown Kathleen M. Carley 27 20 0 19 Oct 2022
K-MHaS: A Multi-label Hate Speech Detection Dataset in Korean Online News Comment Jean Lee Taejun Lim Hee-Youn Lee Bogeun Jo Yangsok Kim Heegeun Yoon S. Han 24 18 0 23 Aug 2022
Overview of Abusive and Threatening Language Detection in Urdu at FIRE 2021 Maaz Amjad Alisa Zhila Grigori Sidorov Andrey Labunets Sabur Butta Hamza Imam Amjad O. Vitman Alexander Gelbukh 8 8 0 14 Jul 2022
Multilingual HateCheck: Functional Tests for Multilingual Hate Speech Detection Models Paul Röttger Haitham Seelawi Debora Nozza Zeerak Talat Bertie Vidgen 30 65 0 20 Jun 2022
Transfer Language Selection for Zero-Shot Cross-Lingual Abusive Language Detection J. Eronen M. Ptaszynski Fumito Masui Masaki Arata Gniewosz Leliwa Michal Wroczynski 19 31 0 02 Jun 2022
KOLD: Korean Offensive Language Dataset Young-kuk Jeong Juhyun Oh Jaimeen Ahn Jongwon Lee Jihyung Mon Sungjoon Park Alice H. Oh 54 25 0 23 May 2022
Handling and Presenting Harmful Text in NLP Research Hannah Rose Kirk Abeba Birhane Bertie Vidgen Leon Derczynski 13 47 0 29 Apr 2022
Justice in Misinformation Detection Systems: An Analysis of Algorithms, Stakeholders, and Potential Harms Terrence Neumann Maria De-Arteaga S. Fazelpour 30 22 0 28 Apr 2022
Korean Online Hate Speech Dataset for Multilabel Classification: How Can Social Science Improve Dataset on Hate Speech? Taeyoung Kang Eunrang Kwon Junbum Lee Youngeun Nam Junmo Song JeongKyu Suh 11 8 0 07 Apr 2022
Using Pre-Trained Language Models for Producing Counter Narratives Against Hate Speech: a Comparative Study Serra Sinem Tekiroğlu Helena Bonaldi Margherita Fanton Marco Guerini 24 43 0 04 Apr 2022
Overview of the HASOC Subtrack at FIRE 2021: Hate Speech and Offensive Content Identification in English and Indo-Aryan Languages Thomas Mandl Sandip J Modha Gautam Kishore Shahi Hiren Madhu Shrey Satapara ... Johannes Schaefer Tharindu Ranasinghe Marcos Zampieri D. Nandini A. Jaiswal 40 69 0 17 Dec 2021
"Stop Asian Hate!" : Refining Detection of Anti-Asian Hate Speech During the COVID-19 Pandemic H. Nghiem Fred Morstatter 25 8 0 04 Dec 2021
In Search of Ambiguity: A Three-Stage Workflow Design to Clarify Annotation Guidelines for Crowd Workers V. Pradhan M. Schaekermann Matthew Lease 26 12 0 04 Dec 2021
The ComMA Dataset V0.2: Annotating Aggression and Bias in Multilingual Social Media Discourse Ritesh Kumar Enakshi Nandi Laishram Niranjana Devi Shyam Ratan Siddharth Singh Akash Bhagat Yogesh Dawer 25 24 0 19 Nov 2021
Not All Comments are Equal: Insights into Comment Moderation from a Topic-Aware Model Elaine Zosa Ravi Shekhar Mladen Karan Matthew Purver 19 2 0 21 Sep 2021
HateCheck: Functional Tests for Hate Speech Detection Models Paul Röttger B. Vidgen Dong Nguyen Zeerak Talat Helen Z. Margetts J. Pierrehumbert 31 259 0 31 Dec 2020