Protecting Language Generation Models via Invisible Watermarking

Protecting Language Generation Models via Invisible Watermarking

6 February 2023

Lei Li

Papers citing "Protecting Language Generation Models via Invisible Watermarking"

16 / 16 papers shown

Title
Attack and defense techniques in large language models: A survey and new perspectives Zhiyu Liao Kang Chen Yuanguo Lin Kangkang Li Yunxuan Liu Hefeng Chen Xingwang Huang Yuanhui Yu AAML 54 0 0 02 May 2025
Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection Guangsheng Bao Yanbin Zhao Juncai He Yue Zhang VLM 92 1 0 20 Feb 2025
Can AI-Generated Text be Reliably Detected? Vinu Sankar Sadasivan Aounon Kumar S. Balasubramanian Wenxiao Wang S. Feizi DeLMO 54 355 0 20 Jan 2025
Ward: Provable RAG Dataset Inference via LLM Watermarks Nikola Jovanović Robin Staab Maximilian Baader Martin Vechev 50 1 0 04 Oct 2024
ModelShield: Adaptive and Robust Watermark against Model Extraction Attack Kaiyi Pang Tao Qi Chuhan Wu Minhao Bai Minghu Jiang Yongfeng Huang AAML WaLM 65 2 0 03 May 2024
Watermarking Makes Language Models Radioactive Tom Sander Pierre Fernandez Alain Durmus Matthijs Douze Teddy Furon WaLM 29 11 0 22 Feb 2024
Embarrassingly Simple Text Watermarks Ryoma Sato Yuki Takezawa Han Bao Kenta Niwa Makoto Yamada WaLM 11 14 0 13 Oct 2023
Necessary and Sufficient Watermark for Large Language Models Yuki Takezawa Ryoma Sato Han Bao Kenta Niwa Makoto Yamada WaLM 45 7 0 02 Oct 2023
Robust Distortion-free Watermarks for Language Models Rohith Kuditipudi John Thickstun Tatsunori Hashimoto Percy Liang WaLM 10 154 0 28 Jul 2023
Three Bricks to Consolidate Watermarks for Large Language Models Pierre Fernandez Antoine Chaffin Karim Tit Vivien Chappelier Teddy Furon WaLM 9 46 0 26 Jul 2023
Watermarking Conditional Text Generation for AI Detection: Unveiling Challenges and a Semantic-Aware Watermark Remedy Yu Fu Deyi Xiong Yue Dong WaLM 41 28 0 25 Jul 2023
Distillation-Resistant Watermarking for Model Protection in NLP Xuandong Zhao Lei Li Yu-Xiang Wang WaLM 88 17 0 07 Oct 2022
CATER: Intellectual Property Protection on Text Generation APIs via Conditional Watermarks Xuanli He Qiongkai Xu Yi Zeng Lingjuan Lyu Fangzhao Wu Jiwei Li R. Jia WaLM 168 71 0 19 Sep 2022
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 301 11,730 0 04 Mar 2022
Protecting Intellectual Property of Language Generation APIs with Lexical Watermark Xuanli He Qiongkai Xu Lingjuan Lyu Fangzhao Wu Chenguang Wang WaLM 166 92 0 05 Dec 2021
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 228 31,150 0 16 Jan 2013