Thieves on Sesame Street! Model Extraction of BERT-based APIs

27 October 2019

Papers citing "Thieves on Sesame Street! Model Extraction of BERT-based APIs"

39 / 39 papers shown

Title
Attack and defense techniques in large language models: A survey and new perspectives Zhiyu Liao Kang Chen Yuanguo Lin Kangkang Li Yunxuan Liu Hefeng Chen Xingwang Huang Yuanhui Yu AAML 54 0 0 02 May 2025
Attackers Can Do Better: Over- and Understated Factors of Model Stealing Attacks Daryna Oliynyk Rudolf Mayer Andreas Rauber AAML 44 0 0 08 Mar 2025
Examining the Threat Landscape: Foundation Models and Model Stealing Ankita Raj Deepankar Varma Chetan Arora AAML 68 1 0 25 Feb 2025
Can't Hide Behind the API: Stealing Black-Box Commercial Embedding Models Manveer Singh Tamber Jasper Xian Jimmy Lin MLAU SILM 140 0 0 13 Jun 2024
Magpie: Alignment Data Synthesis from Scratch by Prompting Aligned LLMs with Nothing Zhangchen Xu Fengqing Jiang Luyao Niu Yuntian Deng Radha Poovendran Yejin Choi Bill Yuchen Lin SyDa 32 111 0 12 Jun 2024
Transferable Embedding Inversion Attack: Uncovering Privacy Risks in Text Embeddings without Model Queries Yu-Hsiang Huang Yuche Tsai Hsiang Hsiao Hong-Yi Lin Shou-De Lin SILM 35 8 0 12 Jun 2024
Tokenization Matters! Degrading Large Language Models through Challenging Their Tokenization Dixuan Wang Yanda Li Junyuan Jiang Zepeng Ding Ziqin Luo Guochao Jiang Jiaqing Liang Deqing Yang 27 11 0 27 May 2024
ModelShield: Adaptive and Robust Watermark against Model Extraction Attack Kaiyi Pang Tao Qi Chuhan Wu Minhao Bai Minghu Jiang Yongfeng Huang AAML WaLM 70 2 0 03 May 2024
RobWE: Robust Watermark Embedding for Personalized Federated Learning Model Ownership Protection Yang Xu Yunlin Tan Cheng Zhang Kai Chi Peng Sun Wenyuan Yang Ju Ren Hongbo Jiang Yaoxue Zhang FedML 52 2 0 29 Feb 2024
Stolen Subwords: Importance of Vocabularies for Machine Translation Model Stealing Vilém Zouhar AAML 35 0 0 29 Jan 2024
Beyond Boundaries: A Comprehensive Survey of Transferable Attacks on AI Systems Guangjing Wang Ce Zhou Yuanda Wang Bocheng Chen Hanqing Guo Qiben Yan AAML SILM 57 3 0 20 Nov 2023
SecurityNet: Assessing Machine Learning Vulnerabilities on Public Models Boyang Zhang Zheng Li Ziqing Yang Xinlei He Michael Backes Mario Fritz Yang Zhang 23 4 0 19 Oct 2023
The False Promise of Imitating Proprietary LLMs Arnav Gudibande Eric Wallace Charles Burton Snell Xinyang Geng Hao Liu Pieter Abbeel Sergey Levine Dawn Song ALM 27 196 0 25 May 2023
GrOVe: Ownership Verification of Graph Neural Networks using Embeddings Asim Waheed Vasisht Duddu Nadarajah Asokan 35 9 0 17 Apr 2023
Randomized Kaczmarz in Adversarial Distributed Setting Longxiu Huang Xia Li Deanna Needell 13 2 0 24 Feb 2023
Model Extraction Attack against Self-supervised Speech Models Tsung-Yuan Hsu Chen An Li Tung-Yu Wu Hung-yi Lee 19 1 0 29 Nov 2022
Free Fine-tuning: A Plug-and-Play Watermarking Scheme for Deep Neural Networks Run Wang Jixing Ren Boheng Li Tianyi She Wenhui Zhang Liming Fang Jing Chen Chao Shen Lina Wang WIGM 32 16 0 14 Oct 2022
CATER: Intellectual Property Protection on Text Generation APIs via Conditional Watermarks Xuanli He Qiongkai Xu Yi Zeng Lingjuan Lyu Fangzhao Wu Jiwei Li R. Jia WaLM 183 71 0 19 Sep 2022
Careful What You Wish For: on the Extraction of Adversarially Trained Models Kacem Khaled Gabriela Nicolescu F. Magalhães MIACV AAML 24 4 0 21 Jul 2022
I Know What You Trained Last Summer: A Survey on Stealing Machine Learning Models and Defences Daryna Oliynyk Rudolf Mayer Andreas Rauber 39 106 0 16 Jun 2022
Learning to Reverse DNNs from AI Programs Automatically Simin Chen Hamed Khanpour Cong Liu Wei Yang 35 15 0 20 May 2022
MEGA: Model Stealing via Collaborative Generator-Substitute Networks Chi Hong Jiyue Huang L. Chen 11 2 0 31 Jan 2022
Security for Machine Learning-based Software Systems: a survey of threats, practices and challenges Huaming Chen Muhammad Ali Babar AAML 29 21 0 12 Jan 2022
Model Stealing Attacks Against Inductive Graph Neural Networks Yun Shen Xinlei He Yufei Han Yang Zhang 16 60 0 15 Dec 2021
First to Possess His Statistics: Data-Free Model Extraction Attack on Tabular Data Masataka Tasumi Kazuki Iwahana Naoto Yanai Katsunari Shishido Toshiya Shimizu Yuji Higuchi I. Morikawa Jun Yajima AAML 26 4 0 30 Sep 2021
SoK: Machine Learning Governance Varun Chandrasekaran Hengrui Jia Anvith Thudi Adelin Travers Mohammad Yaghini Nicolas Papernot 30 16 0 20 Sep 2021
Student Surpasses Teacher: Imitation Attack for Black-Box NLP APIs Qiongkai Xu Xuanli He Lingjuan Lyu Lizhen Qu Gholamreza Haffari MLAU 30 21 0 29 Aug 2021
SoK: How Robust is Image Classification Deep Neural Network Watermarking? (Extended Version) Nils Lukas Edward Jiang Xinda Li Florian Kerschbaum AAML 28 86 0 11 Aug 2021
Survey: Leakage and Privacy at Inference Time Marija Jegorova Chaitanya Kaul Charlie Mayor Alison Q. OÑeil Alexander Weir Roderick Murray-Smith Sotirios A. Tsaftaris PILM MIACV 17 71 0 04 Jul 2021
HODA: Hardness-Oriented Detection of Model Extraction Attacks A. M. Sadeghzadeh Amir Mohammad Sobhanian F. Dehghan R. Jalili MIACV 17 7 0 21 Jun 2021
Quantifying and Mitigating Privacy Risks of Contrastive Learning Xinlei He Yang Zhang 11 51 0 08 Feb 2021
Towards Zero-Shot Knowledge Distillation for Natural Language Processing Ahmad Rashid Vasileios Lioutas Abbas Ghaddar Mehdi Rezagholizadeh 13 27 0 31 Dec 2020
Developing Future Human-Centered Smart Cities: Critical Analysis of Smart City Security, Interpretability, and Ethical Challenges Kashif Ahmad Majdi Maabreh M. Ghaly Khalil Khan Junaid Qadir Ala I. Al-Fuqaha 19 142 0 14 Dec 2020
Black-Box Ripper: Copying black-box models using generative evolutionary algorithms Antonio Bărbălău Adrian Cosma Radu Tudor Ionescu Marius Popescu MIACV MLAU 14 43 0 21 Oct 2020
Knowledge-Enriched Distributional Model Inversion Attacks Si-An Chen Mostafa Kahla R. Jia Guo-Jun Qi 16 93 0 08 Oct 2020
Adversarial Watermarking Transformer: Towards Tracing Text Provenance with Data Hiding Sahar Abdelnabi Mario Fritz WaLM 18 143 0 07 Sep 2020
A Survey of Privacy Attacks in Machine Learning M. Rigaki Sebastian Garcia PILM AAML 25 213 0 15 Jul 2020
Deep Neural Network Fingerprinting by Conferrable Adversarial Examples Nils Lukas Yuxuan Zhang Florian Kerschbaum MLAU FedML AAML 28 144 0 02 Dec 2019
Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles Balaji Lakshminarayanan Alexander Pritzel Charles Blundell UQCV BDL 270 5,660 0 05 Dec 2016