v1v2 (latest)

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

Computer Vision and Pattern Recognition (CVPR), 2022

25 August 2022

Nataniel Ruiz

Yuanzhen Li

Varun Jampani

Yael Pritch

Michael Rubinstein

Kfir Aberman

ArXiv (abs)PDF HTML HuggingFace (12 upvotes)

Papers citing "DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation"

50 / 2,539 papers shown

Content-based Unrestricted Adversarial AttackNeural Information Processing Systems (NeurIPS), 2023

Zhaoyu Chen

349

104

18 May 2023

FastComposer: Tuning-Free Multi-Subject Image Generation with Localized AttentionInternational Journal of Computer Vision (IJCV), 2023

William T. Freeman

Song Han

331

349

17 May 2023

Preserve Your Own Correlation: A Noise Prior for Video Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

387

299

17 May 2023

Generating coherent comic with rich story using ChatGPT and Stable Diffusion

Ze Jin

Zorina Song

DiffM

131

16 May 2023

Make-A-Protagonist: Generic Video Editing with An Ensemble of Experts

Lanqing Hong

196

15 May 2023

Null-text Guidance in Diffusion Models is Secretly a Cartoon-style CreatorACM Multimedia (ACM MM), 2023

Wenjing Yang

313

11 May 2023

Visual TuningACM Computing Surveys (ACM Comput. Surv.), 2023

...

438

10 May 2023

iEdit: Localised Text-guided Image Editing with Weak Supervision

196

10 May 2023

Text-guided High-definition Consistency Texture Model

Zhibin Tang

Tiantong He

DiffM

118

10 May 2023

SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with Large Language ModelsACM Multimedia (ACM MM), 2023

376

09 May 2023

Prompt Tuning Inversion for Text-Driven Image Editing Using Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

265

08 May 2023

Text-to-Image Diffusion Models can be Easily Backdoored through Multimodal Data PoisoningACM Multimedia (ACM MM), 2023

Yinpeng Dong

Hang Su

233

100

07 May 2023

AADiff: Audio-Aligned Video Synthesis with Text-to-Image Diffusion

Nojun Kwak

280

06 May 2023

Towards Prompt-robust Face Privacy Protection via Adversarial Decoupling Augmentation Framework

184

06 May 2023

DisenBooth: Identity-Preserving Disentangled Tuning for Subject-Driven Text-to-Image GenerationInternational Conference on Learning Representations (ICLR), 2023

351

05 May 2023

Personalize Segment Anything Model with One ShotInternational Conference on Learning Representations (ICLR), 2023

Ziyu Guo

396

295

04 May 2023

Multimodal-driven Talking Face Generation via a Unified Diffusion-based Generator

Chao Xu

Shaoting Zhu

Junwei Zhu

Alexander I. Rudnicky

Jiangning Zhang

Ying Tai

Yong Liu

DiffM

239

04 May 2023

Few-shot Domain-Adaptive Visually-fused Event Detection from TextFusion (Fusion), 2023

Van Nguyen

223

04 May 2023

Key-Locked Rank One Editing for Text-to-Image PersonalizationInternational Conference on Computer Graphics and Interactive Techniques (SIGGRAPH), 2023

432

217

02 May 2023

DreamPaint: Few-Shot Inpainting of E-Commerce Items for Virtual Try-On without 3D Modeling

183

02 May 2023

In-Context Learning Unlocked for Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

Mingyuan Zhou

338

01 May 2023

Let the Chart Spark: Embedding Semantic Context into Chart with Text-to-Image Generative ModelIEEE Transactions on Visualization and Computer Graphics (TVCG), 2023

346

28 Apr 2023

Generating images of rare concepts using pre-trained diffusion modelsAAAI Conference on Artificial Intelligence (AAAI), 2023

531

27 Apr 2023

Motion-Conditioned Diffusion Model for Controllable Video Synthesis

399

27 Apr 2023

Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated ImagesNeural Information Processing Systems (NeurIPS), 2023

Zeyu Lu

Di Huang

Wanli Ouyang

265

25 Apr 2023

Exploring Compositional Visual Generation with Latent Classifier Guidance

297

25 Apr 2023

Patch Diffusion: Faster and More Data-Efficient Training of Diffusion ModelsNeural Information Processing Systems (NeurIPS), 2023

Huangjie Zheng

Mingyuan Zhou

253

160

25 Apr 2023

Hierarchical Diffusion Autoencoders and Disentangled Image ManipulationIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Zeyu Lu

Yu Qiao

271

24 Apr 2023

Speed Is All You Need: On-Device Acceleration of Large Diffusion Models via GPU-Aware Optimizations

276

21 Apr 2023

Building Multimodal AI Chatbots

Mingyu Lee

156

21 Apr 2023

Collaborative Diffusion for Multi-Modal Face Generation and EditingComputer Vision and Pattern Recognition (CVPR), 2023

Ziwei Liu

229

154

20 Apr 2023

Image retrieval outperforms diffusion models on data augmentation

Francesco Locatello

273

20 Apr 2023

UPGPT: Universal Diffusion Model for Person Image Generation, Editing and Pose Transfer

230

18 Apr 2023

Align your Latents: High-Resolution Video Synthesis with Latent Diffusion ModelsComputer Vision and Pattern Recognition (CVPR), 2023

Sanja Fidler

610

1,440

18 Apr 2023

MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and EditingIEEE International Conference on Computer Vision (ICCV), 2023

Ying Shan

232

680

17 Apr 2023

Identity Encoder for Personalized Diffusion

208

14 Apr 2023

Text-Conditional Contextualized Avatars For Zero-Shot Personalization

Devi Parikh

145

14 Apr 2023

Delta Denoising ScoreIEEE International Conference on Computer Vision (ICCV), 2023

Amir Hertz

Kfir Aberman

Daniel Cohen-Or

DiffM

281

118

14 Apr 2023

One-Shot Stylization for Full-Body Human Images

Aiyu Cui

Svetlana Lazebnik

3DH

231

14 Apr 2023

Expressive Text-to-Image Generation with Rich TextIEEE International Conference on Computer Vision (ICCV), 2023

Jun-Yan Zhu

482

13 Apr 2023

DiffFit: Unlocking Transferability of Large Diffusion Models via Simple Parameter-Efficient Fine-TuningIEEE International Conference on Computer Vision (ICCV), 2023

620

13 Apr 2023

PATMAT: Person Aware Tuning of Mask-Aware Transformer for Face InpaintingIEEE International Conference on Computer Vision (ICCV), 2023

279

12 Apr 2023

Continual Diffusion: Continual Customization of Text-to-Image Diffusion with C-LoRA

449

144

12 Apr 2023

DreamPose: Fashion Image-to-Video Synthesis via Stable DiffusionIEEE International Conference on Computer Vision (ICCV), 2023

J. Karras

Aleksander Holynski

Ting-Chun Wang

Ira Kemelmacher-Shlizerman

DiffM VGen

363

205

12 Apr 2023

Gradient-Free Textual InversionACM Multimedia (ACM MM), 2023

Zhengcong Fei

Mingyuan Fan

Junshi Huang

DiffM

260

12 Apr 2023

CLIP Surgery for Better Explainability with Enhancement in Open-Vocabulary TasksPattern Recognition (Pattern Recogn.), 2023

Yiqun Duan

129

12 Apr 2023

NeAT: Neural Artistic Tracing for Beautiful Style Transfer

219

11 Apr 2023

EKILA: Synthetic Media Provenance and Attribution for Generative Art

195

10 Apr 2023

Defense-Prefix for Preventing Typographic Attacks on CLIP

Hiroki Azuma

Yusuke Matsui

VLM AAML

293

10 Apr 2023

Towards Real-time Text-driven Image Manipulation with Unconditional Diffusion Models

272

10 Apr 2023