v1v2 (latest)

InstructPix2Pix: Learning to Follow Image Editing Instructions

Computer Vision and Pattern Recognition (CVPR), 2022

17 November 2022

Tim Brooks

Aleksander Holynski

Alexei A. Efros

DiffM

ArXiv (abs)PDF HTML HuggingFace (4 upvotes)

Papers citing "InstructPix2Pix: Learning to Follow Image Editing Instructions"

50 / 1,733 papers shown

PRINTER:Deformation-Aware Adversarial Learning for Virtual IHC Staining with In Situ Fidelity

01 Sep 2025

CompSlider: Compositional Slider for Disentangled Multiple-Attribute Image Generation

230

31 Aug 2025

Mixture of Global and Local Experts with Diffusion Transformer for Controllable Face Generation

191

30 Aug 2025

3D-LATTE: Latent Space 3D Editing from Textual Instructions

291

29 Aug 2025

Describe, Don't Dictate: Semantic Image Editing with Natural Language Intent

28 Aug 2025

Evaluating Compositional Generalisation in VLMs and Diffusion Models

152

28 Aug 2025

DrivingGaussian++: Towards Realistic Reconstruction and Editable Simulation for Surrounding Dynamic Driving Scenes

130

28 Aug 2025

CraftGraffiti: Exploring Human Identity with Custom Graffiti Art via Facial-Preserving Diffusion Models

113

28 Aug 2025

Articulate3D: Zero-Shot Text-Driven 3D Object Posing

26 Aug 2025

OmniHuman-1.5: Instilling an Active Mind in Avatars via Cognitive Simulation

131

26 Aug 2025

Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization

128

25 Aug 2025

From Global to Local: Social Bias Transfer in CLIP

118

25 Aug 2025

SpotEdit: Evaluating Visually-Guided Image Editing Methods

151

25 Aug 2025

An LLM-LVLM Driven Agent for Iterative and Fine-Grained Image Editing

24 Aug 2025

PromptFlare: Prompt-Generalized Defense via Cross-Attention Decoy in Diffusion-Based Inpainting

120

22 Aug 2025

GenTune: Toward Traceable Prompts to Improve Controllability of Image Refinement in Environment DesignACM Symposium on User Interface Software and Technology (UIST), 2025

168

21 Aug 2025

Tinker: Diffusion's Gift to 3D--Multi-View Consistent Editing From Sparse Inputs without Per-Scene Optimization

187

20 Aug 2025

AnchorSync: Global Consistency Optimization for Long Video Editing

155

20 Aug 2025

Ouroboros: Single-step Diffusion Models for Cycle-consistent Forward and Inverse Rendering

172

20 Aug 2025

Beyond Simple Edits: Composed Video Retrieval with Dense Modifications

100

19 Aug 2025

Odo: Depth-Guided Diffusion for Identity-Preserving Body Reshaping

214

18 Aug 2025

Single-Reference Text-to-Image Manipulation with Dual Contrastive Denoising Score

Syed Muhmmad Israr

Feng Zhao

DiffM

155

18 Aug 2025

CoreEditor: Consistent 3D Editing via Correspondence-constrained Diffusion

149

15 Aug 2025

SPG: Style-Prompting Guidance for Style-Specific Content Creation

130

15 Aug 2025

NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale

...

216

14 Aug 2025

Empowering Multimodal LLMs with External Tools: A Comprehensive Survey

183

14 Aug 2025

A Survey on 3D Gaussian Splatting Applications: Segmentation, Editing, and Generation

296

13 Aug 2025

SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fidelity Head Reconstruction and Real-Time Editing

140

13 Aug 2025

Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation

...

216

13 Aug 2025

Stable Diffusion Models are Secretly Good at Visual In-Context Learning

Trevine Oorloff

Vishwanath Sindagi

Wele Gedara Chaminda Bandara

167

13 Aug 2025

Training-Free Text-Guided Color Editing with Multi-Modal Diffusion Transformer

145

12 Aug 2025

Exploring Multimodal Diffusion Transformers for Enhanced Prompt-based Image Editing

122

11 Aug 2025

Splat4D: Diffusion-Enhanced 4D Gaussian Splatting for Temporally and Spatially Consistent Content Creation

103

11 Aug 2025

Make Your MoVe: Make Your 3D Contents by Adapting Multi-View Diffusion Models to External Editing

11 Aug 2025

TBAC-UniImage: Unified Understanding and Generation by Ladder-Side Diffusion Tuning

Junzhe Xu

Yuyang Yin

Xi Chen

233

11 Aug 2025

CObL: Toward Zero-Shot Ordinal Layering without User Prompting

127

11 Aug 2025

WeatherDiffusion: Controllable Weather Editing in Intrinsic Space

184

09 Aug 2025

CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing

203

09 Aug 2025

NEP: Autoregressive Image Editing via Next Editing Token Prediction

146

08 Aug 2025

A Study of the Framework and Real-World Applications of Language Embedding for 3D Scene Understanding

Mahmoud Chick Zaouali

287

07 Aug 2025

Neural Speech Extraction with Human Feedback

05 Aug 2025

Draw Your Mind: Personalized Generation via Condition-Level Modeling in Text-to-Image Diffusion Models

130

05 Aug 2025

Skywork UniPic: Unified Autoregressive Modeling for Visual Understanding and Generation

...

132

05 Aug 2025

Zero Shot Domain Adaptive Semantic Segmentation by Synthetic Data Generation and Progressive Adaptation

Jun Luo

Zijing Zhao

Yang Liu

160

05 Aug 2025

EditGarment: An Instruction-Based Garment Editing Dataset Constructed with Automated MLLM Synthesis and Semantic-Aware Evaluation

182

05 Aug 2025

MILD: Multi-Layer Diffusion Strategy for Complex and Precise Multi-IP Aware Human Erasing

199

05 Aug 2025

DreamPainter: Image Background Inpainting for E-commerce Scenarios

114

04 Aug 2025

Optimal Transport for Rectified Flow Image Editing: Unifying Inversion-Based and Direct Methods

Marian Lupascu

Mihai-Sorin Stupariu

DiffM

259

04 Aug 2025

Qwen-Image Technical Report

...

349

239

04 Aug 2025

AttriCtrl: Fine-Grained Control of Aesthetic Attribute Intensity in Diffusion Models

142

04 Aug 2025