v1v2 (latest)

On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts

25 October 2023

Michael Backes

ArXiv (abs)PDF HTML Github

Papers citing "On the Proactive Generation of Unsafe Images From Text-To-Image Models Using Benign Prompts"

50 / 51 papers shown

Patronus: Safeguarding Text-to-Image Models against White-Box Adversaries

151

18 Oct 2025

Attacks on Approximate Caches in Text-to-Image Diffusion Models

213

28 Aug 2025

Understanding Implosion in Text-to-Image Generative ModelsConference on Computer and Communications Security (CCS), 2024

Wenxin Ding

Cathy Y. Li

Shawn Shan

Ben Y. Zhao

Haitao Zheng

380

18 Sep 2024

Image-Perfect Imperfections: Safety, Bias, and Authenticity in the Shadow of Text-To-Image Model EvolutionConference on Computer and Communications Security (CCS), 2024

Yixin Wu

Yun Shen

Michael Backes

Yang Zhang

312

30 Aug 2024

Replication in Visual Diffusion Models: A Survey and Outlook

Yifan Sun

606

07 Jul 2024

Toxic Memes: A Survey of Computational Perspectives on the Detection and Explanation of Meme Toxicities

Delfina Sol Martinez Pandiani

Erik Tjong Kim Sang

Davide Ceolin

286

11 Jun 2024

UnsafeBench: Benchmarking Image Safety Classifiers on Real-World and AI-Generated Images

556

06 May 2024

Shadowcast: Stealthy Data Poisoning Attacks Against Vision-Language ModelsNeural Information Processing Systems (NeurIPS), 2024

Furong Huang

353

05 Feb 2024

VA3: Virtually Assured Amplification Attack on Probabilistic Copyright Protection for Text-to-Image Generative ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Xiang Li

Qianli Shen

Kenji Kawaguchi

376

29 Nov 2023

Nightshade: Prompt-Specific Poisoning Attacks on Text-to-Image Generative Models

443

20 Oct 2023

Composite Backdoor Attacks Against Large Language Models

Michael Backes

242

11 Oct 2023

Towards Safe Self-Distillation of Internet-Scale Text-to-Image Diffusion Models

211

12 Jul 2023

SDXL: Improving Latent Diffusion Models for High-Resolution Image SynthesisInternational Conference on Learning Representations (ICLR), 2023

2.2K

4,342

04 Jul 2023

Unsafe Diffusion: On the Generation of Unsafe Images and Hateful Memes From Text-To-Image ModelsConference on Computer and Communications Security (CCS), 2023

Michael Backes

343

192

23 May 2023

Uncurated Image-Text Datasets: Shedding Light on Demographic BiasComputer Vision and Pattern Recognition (CVPR), 2023

235

06 Apr 2023

Erasing Concepts from Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

668

506

13 Mar 2023

On the Evolution of (Hateful) Memes by Means of Multimodal Contrastive Learning

Michael Backes

216

13 Dec 2022

How to Backdoor Diffusion Models?Computer Vision and Pattern Recognition (CVPR), 2022

Sheng-Yen Chou

Pin-Yu Chen

Tsung-Yi Ho

DiffM SILM

541

130

11 Dec 2022

InstructPix2Pix: Learning to Follow Image Editing InstructionsComputer Vision and Pattern Recognition (CVPR), 2022

Tim Brooks

Aleksander Holynski

Alexei A. Efros

DiffM

1.6K

2,788

17 Nov 2022

Safe Latent Diffusion: Mitigating Inappropriate Degeneration in Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2022

641

504

09 Nov 2022

Easily Accessible Text-to-Image Generation Amplifies Demographic Stereotypes at Large ScaleConference on Fairness, Accountability and Transparency (FAccT), 2022

Esin Durmus

Tatsunori Hashimoto

Dan Jurafsky

James Zou

Aylin Caliskan

DiffM VLM

442

461

07 Nov 2022

Imagic: Text-Based Real Image Editing with Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2022

840

1,421

17 Oct 2022

LAION-5B: An open large-scale dataset for training next generation image-text modelsNeural Information Processing Systems (NeurIPS), 2022

...

1.3K

4,907

16 Oct 2022

Adapting Pretrained Vision-Language Foundational Models to Medical Imaging Domains

260

141

09 Oct 2022

Red-Teaming the Stable Diffusion Safety Filter

803

275

03 Oct 2022

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven GenerationComputer Vision and Pattern Recognition (CVPR), 2022

Nataniel Ruiz

Yuanzhen Li

Varun Jampani

Yael Pritch

Michael Rubinstein

Kfir Aberman

1.5K

4,054

25 Aug 2022

An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual InversionInternational Conference on Learning Representations (ICLR), 2022

Daniel Cohen-Or

764

2,595

02 Aug 2022

Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

...

1.0K

1,439

22 Jun 2022

Hierarchical Text-Conditional Image Generation with CLIP Latents

1.5K

8,694

13 Apr 2022

BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and GenerationInternational Conference on Machine Learning (ICML), 2022

1.5K

6,338

28 Jan 2022

High-Resolution Image Synthesis with Latent Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2021

4.7K

23,267

20 Dec 2021

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion ModelsInternational Conference on Machine Learning (ICML), 2021

1.3K

4,600

20 Dec 2021

Learning Transferable Visual Models From Natural Language SupervisionInternational Conference on Machine Learning (ICML), 2021

...

2.2K

45,649

26 Feb 2021

Zero-Shot Text-to-Image GenerationInternational Conference on Machine Learning (ICML), 2021

1.1K

6,273

24 Feb 2021

Neural Attention Distillation: Erasing Backdoor Triggers from Deep Neural NetworksInternational Conference on Learning Representations (ICLR), 2021

521

530

15 Jan 2021

Dataset Security for Machine Learning: Data Poisoning, Backdoor Attacks, and DefensesIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2020

Chulin Xie

598

382

18 Dec 2020

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

Alexey Dosovitskiy

...

1.6K

59,353

22 Oct 2020

Backdoor Attacks and Countermeasures on Deep Learning: A Comprehensive Review

400

276

21 Jul 2020

Backdoor Learning: A SurveyIEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS), 2020

726

784

17 Jul 2020

Data Poisoning Attacks Against Federated Learning SystemsEuropean Symposium on Research in Computer Security (ESORICS), 2020

Mehmet Emre Gursoy

408

870

16 Jul 2020

Attack of the Tails: Yes, You Really Can Backdoor Federated LearningNeural Information Processing Systems (NeurIPS), 2020

Hongyi Wang

Kartik K. Sreenivasan

Saurabh Agarwal

Dimitris Papailiopoulos

FedML

445

782

09 Jul 2020

Denoising Diffusion Probabilistic Models

Jonathan Ho

Ajay Jain

Pieter Abbeel

DiffM

6.0K

28,926

19 Jun 2020

The Hateful Memes Challenge: Detecting Hate Speech in Multimodal Memes

Douwe Kiela

Amanpreet Singh

473

839

10 May 2020

Decision-Making with Auto-Encoding Variational BayesNeural Information Processing Systems (NeurIPS), 2020

Romain Lopez

Pierre Boyeau

Nir Yosef

Michael I. Jordan

Jeffrey Regier

BDL

1.7K

20,656

17 Feb 2020

Poison Frogs! Targeted Clean-Label Poisoning Attacks on Neural Networks

811

1,241

03 Apr 2018

Manipulating Machine Learning: Poisoning Attacks and Countermeasures for Regression Learning

Battista Biggio

405

859

01 Apr 2018

Technical Report: When Does Machine Learning FAIL? Generalized Transferability for Evasion and Poisoning Attacks

349

320

19 Mar 2018

Machine Learning Models that Remember Too Much

317

575

22 Sep 2017

BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain

776

2,137

22 Aug 2017

Understanding Black-box Predictions via Influence Functions

Pang Wei Koh

Abigail Z. Jacobs

TDI

673

3,443

14 Mar 2017