Learning to Refuse: Towards Mitigating Privacy Risks in LLMs

Learning to Refuse: Towards Mitigating Privacy Risks in LLMs

14 July 2024

Papers citing "Learning to Refuse: Towards Mitigating Privacy Risks in LLMs"

11 / 11 papers shown

Title
Malicious and Unintentional Disclosure Risks in Large Language Models for Code Generation Rafiqul Rabin Sean McGregor Nick Judd AAML PILM 52 0 0 27 Mar 2025
ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging Haoming Xu Shuxun Wang Yanqiu Zhao Yi Zhong Ziyan Jiang Ningyuan Zhao Shumin Deng H. Chen N. Zhang MoMe MU 61 0 0 27 Mar 2025
Holistic Audit Dataset Generation for LLM Unlearning via Knowledge Graph Traversal and Redundancy Removal Weipeng Jiang Juan Zhai Shiqing Ma Ziyan Lei Xiaofei Xie Yige Wang Chao Shen MU 59 0 0 26 Feb 2025
Which Retain Set Matters for LLM Unlearning? A Case Study on Entity Unlearning Hwan Chang Hwanhee Lee MU 37 0 0 17 Feb 2025
ReLearn: Unlearning via Learning for Large Language Models Haoming Xu Ningyuan Zhao Liming Yang Sendong Zhao Shumin Deng Mengru Wang Bryan Hooi Nay Oo H. Chen N. Zhang KELM CLL MU 51 0 0 16 Feb 2025
Auto-Evaluation with Few Labels through Post-hoc Regression Benjamin Eyre David Madras 56 1 0 19 Nov 2024
A Closer Look at Machine Unlearning for Large Language Models Xiaojian Yuan Tianyu Pang Chao Du Kejiang Chen Weiming Zhang Min-Bin Lin MU 28 5 0 10 Oct 2024
Probing Language Models for Pre-training Data Detection Zhenhua Liu Tong Zhu Chuanyuan Tan Haonan Lu Bing Liu Wenliang Chen 21 2 0 03 Jun 2024
Who's Harry Potter? Approximate Unlearning in LLMs Ronen Eldan M. Russinovich MU MoMe 98 171 0 03 Oct 2023
Knowledge Unlearning for Mitigating Privacy Risks in Language Models Joel Jang Dongkeun Yoon Sohee Yang Sungmin Cha Moontae Lee Lajanugen Logeswaran Minjoon Seo KELM PILM MU 142 110 0 04 Oct 2022
Extracting Training Data from Large Language Models Nicholas Carlini Florian Tramèr Eric Wallace Matthew Jagielski Ariel Herbert-Voss ... Tom B. Brown D. Song Ulfar Erlingsson Alina Oprea Colin Raffel MLAU SILM 264 1,798 0 14 Dec 2020