Privacy-Preserving Data Deduplication for Enhancing Federated Learning of Language Models

11 July 2024

Papers citing "Privacy-Preserving Data Deduplication for Enhancing Federated Learning of Language Models"

5 / 5 papers shown

Title
Impact of Data Duplication on Deep Neural Network-Based Image Classifiers: Robust vs. Standard Models Alireza Aghabagherloo Aydin Abadi Sumanta Sarkar Vishnu Asutosh Dasu Bart Preneel AAML 48 0 0 01 Apr 2025
Decepticons: Corrupted Transformers Breach Privacy in Federated Learning for Language Models Liam H. Fowl Jonas Geiping Steven Reich Yuxin Wen Wojtek Czaja Micah Goldblum Tom Goldstein FedML 68 55 0 29 Jan 2022
Deduplicating Training Data Makes Language Models Better Katherine Lee Daphne Ippolito A. Nystrom Chiyuan Zhang Douglas Eck Chris Callison-Burch Nicholas Carlini SyDa 234 447 0 14 Jul 2021
Carbon Emissions and Large Neural Network Training David A. Patterson Joseph E. Gonzalez Quoc V. Le Chen Liang Lluís-Miquel Munguía D. Rothchild David R. So Maud Texier J. Dean AI4CE 233 626 0 21 Apr 2021
Extracting Training Data from Large Language Models Nicholas Carlini Florian Tramèr Eric Wallace Matthew Jagielski Ariel Herbert-Voss ... Tom B. Brown D. Song Ulfar Erlingsson Alina Oprea Colin Raffel MLAU SILM 264 1,798 0 14 Dec 2020