Identifying and Mitigating Privacy Risks Stemming from Language Models: A Survey

27 September 2023

Victoria Smith

Ali Shahin Shamsabadi

Papers citing "Identifying and Mitigating Privacy Risks Stemming from Language Models: A Survey"

21 / 21 papers shown

Title
LLM Security: Vulnerabilities, Attacks, Defenses, and Countermeasures Francisco Aguilera-Martínez Fernando Berzal PILM 45 0 0 02 May 2025
On the Privacy Risk of In-context Learning Haonan Duan Adam Dziedzic Mohammad Yaghini Nicolas Papernot Franziska Boenisch SILM PILM 55 35 0 15 Nov 2024
Undesirable Memorization in Large Language Models: A Survey Ali Satvaty Suzan Verberne Fatih Turkmen ELM PILM 60 7 0 03 Oct 2024
"I'm categorizing LLM as a productivity tool": Examining ethics of LLM use in HCI research practices Shivani Kapania Ruiyi Wang Toby Jia-Jun Li Tianshi Li Hong Shen 16 6 0 28 Mar 2024
De-amplifying Bias from Differential Privacy in Language Model Fine-tuning Sanjari Srivastava Piotr (Peter) Mardziel Zhikhun Zhang Archana Ahlawat Anupam Datta John C. Mitchell 14 1 0 07 Feb 2024
Black-Box Access is Insufficient for Rigorous AI Audits Stephen Casper Carson Ezell Charlotte Siegmann Noam Kolt Taylor Lynn Curtis ... Michael Gerovitch David Bau Max Tegmark David M. Krueger Dylan Hadfield-Menell AAML 8 75 0 25 Jan 2024
Who's Harry Potter? Approximate Unlearning in LLMs Ronen Eldan M. Russinovich MU MoMe 101 171 0 03 Oct 2023
Privacy-Preserving In-Context Learning for Large Language Models Tong Wu Ashwinee Panda Jiachen T. Wang Prateek Mittal 36 29 0 02 May 2023
Prompt as Triggers for Backdoor Attack: Examining the Vulnerability in Language Models Shuai Zhao Jinming Wen Anh Tuan Luu J. Zhao Jie Fu SILM 51 88 0 02 May 2023
Knowledge Unlearning for Mitigating Privacy Risks in Language Models Joel Jang Dongkeun Yoon Sohee Yang Sungmin Cha Moontae Lee Lajanugen Logeswaran Minjoon Seo KELM PILM MU 145 110 0 04 Oct 2022
Text Revealer: Private Text Reconstruction via Model Inversion Attacks against Transformers Ruisi Zhang Seira Hidano F. Koushanfar SILM 58 26 0 21 Sep 2022
M^4I: Multi-modal Models Membership Inference Pingyi Hu Zihan Wang Ruoxi Sun Hu Wang Minhui Xue 27 25 0 15 Sep 2022
Memorization in NLP Fine-tuning Methods Fatemehsadat Mireshghallah Archit Uniyal Tianhao Wang David E. Evans Taylor Berg-Kirkpatrick AAML 55 39 0 25 May 2022
Decepticons: Corrupted Transformers Breach Privacy in Federated Learning for Language Models Liam H. Fowl Jonas Geiping Steven Reich Yuxin Wen Wojtek Czaja Micah Goldblum Tom Goldstein FedML 68 55 0 29 Jan 2022
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models Jason W. Wei Xuezhi Wang Dale Schuurmans Maarten Bosma Brian Ichter F. Xia Ed H. Chi Quoc Le Denny Zhou LM&Ro LRM AI4CE ReLM 315 8,261 0 28 Jan 2022
Differentially Private Fine-tuning of Language Models Da Yu Saurabh Naik A. Backurs Sivakanth Gopi Huseyin A. Inan ... Y. Lee Andre Manoel Lukas Wutschitz Sergey Yekhanin Huishuai Zhang 128 258 0 13 Oct 2021
Deduplicating Training Data Makes Language Models Better Katherine Lee Daphne Ippolito A. Nystrom Chiyuan Zhang Douglas Eck Chris Callison-Burch Nicholas Carlini SyDa 234 447 0 14 Jul 2021
Killing One Bird with Two Stones: Model Extraction and Attribute Inference Attacks against BERT-based APIs Chen Chen Xuanli He Lingjuan Lyu Fangzhao Wu SILM MIACV 42 5 0 23 May 2021
Extracting Training Data from Large Language Models Nicholas Carlini Florian Tramèr Eric Wallace Matthew Jagielski Ariel Herbert-Voss ... Tom B. Brown D. Song Ulfar Erlingsson Alina Oprea Colin Raffel MLAU SILM 264 1,798 0 14 Dec 2020
Systematic Evaluation of Privacy Risks of Machine Learning Models Liwei Song Prateek Mittal MIACV 168 283 0 24 Mar 2020
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 228 29,632 0 16 Jan 2013