InstantID: Zero-shot Identity-Preserving Generation in Seconds

15 January 2024

Xu Bai

Huaxia Li

Xu Tang

Yao Hu

ArXiv PDF HTML

Papers citing "InstantID: Zero-shot Identity-Preserving Generation in Seconds"

50 / 50 papers shown

Title
Photovoltaic Defect Image Generator with Boundary Alignment Smoothing Constraint for Domain Shift Mitigation Dongying Li Binyi Su Hua Zhang Yong Li Haiyong Chen 44 0 0 09 May 2025
Generating Synthetic Data via Augmentations for Improved Facial Resemblance in DreamBooth and InstantID Koray Ulusan Benjamin Kiefer DiffM 24 0 0 06 May 2025
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities X. Zhang Jintao Guo Shanshan Zhao Minghao Fu Lunhao Duan Guo-Hua Wang Qing-Guo Chen Zhao Xu Weihua Luo Kaifu Zhang DiffM 57 0 0 05 May 2025
RepText: Rendering Visual Text via Replicating H. Wang Y. Xu Y. Li J. Li Chaowei Zhang J. Wang Kejia Yang Z. Chen VLM 66 0 0 28 Apr 2025
DreamO: A Unified Framework for Image Customization Chong Mou Yanze Wu Wenxu Wu Zinan Guo Pengze Zhang ... Shaojin Wu S. Zhao Jian Andrew Zhang Qian He Xinglong Wu 44 0 0 23 Apr 2025
Cobra: Efficient Line Art COlorization with BRoAder References Junhao Zhuang Lingen Li Xuan Ju Zhaoyang Zhang C. Yuan Ying Shan DiffM 62 0 0 16 Apr 2025
ID-Booth: Identity-consistent Face Generation with Diffusion Models Darian Tomašević Fadi Boutros Chenhao Lin Naser Damer Vitomir Štruc Peter Peer DiffM 55 1 0 10 Apr 2025
GPT-ImgEval: A Comprehensive Benchmark for Diagnosing GPT4o in Image Generation Zhiyuan Yan Junyan Ye Weijia Li Zilong Huang Shenghai Yuan Xiangyang He Kaiqing Lin Jun-Jian He Conghui He Li Yuan MLLM EGVM 88 8 0 03 Apr 2025
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization Barış Batuhan Topal Umut Özyurt Zafer Doğan Budak Ramazan Gokberk Cinbis 40 0 0 28 Mar 2025
UniVG: A Generalist Diffusion Model for Unified Image Generation and Editing Tsu-jui Fu Yusu Qian Chen Chen Wenze Hu Zhe Gan Y. Yang 85 1 0 16 Mar 2025
Personalize Anything for Free with Diffusion Transformer Haoran Feng Zehuan Huang Lin Li Hairong Lv Lu Sheng DiffM 72 1 0 16 Mar 2025
DynamicID: Zero-Shot Multi-ID Image Personalization with Flexible Facial Editability Xirui Hu Jiahao Wang Hao Chen Weizhan Zhang Benqi Wang Y. Li Haishun Nan DiffM 60 0 0 09 Mar 2025
Zero-Shot Head Swapping in Real-World Scenarios S. Jeong Taewoong Kang Hyojin Jang Jaegul Choo 34 0 0 02 Mar 2025
InstaFace: Identity-Preserving Facial Editing with Single Image Inference MD Wahiduzzaman Khan Mingshan Jia Shaolin Zhang En Yu Caifeng Shan Kaska Musial-Gabrys DiffM 52 0 0 27 Feb 2025
Phantom: Subject-consistent video generation via cross-modal alignment Lijie Liu Tianxiang Ma Bingchuan Li Zhuowei Chen Jiawei Liu Qian He Xinglong Wu Qian He Xinglong Wu DiffM VGen 50 5 0 16 Feb 2025
I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models Zhenxing Mi Kuan-Chieh Jackson Wang Guocheng Qian Hanrong Ye Runtao Liu Sergey Tulyakov Kfir Aberman Dan Xu LRM 42 0 0 12 Feb 2025
ComposeAnyone: Controllable Layout-to-Human Generation with Decoupled Multimodal Conditions Shiyue Zhang Zheng Chong Xi Lu Wenqing Zhang Haoxiang Li Xujie Zhang Jiehui Huang Xiao Dong Xiaodan Liang DiffM 40 0 0 21 Jan 2025
Multi-subject Open-set Personalization in Video Generation Tsai-Shien Chen Aliaksandr Siarohin Willi Menapace Yuwei Fang Kwot Sin Lee Ivan Skorokhodov Kfir Aberman Jun-Yan Zhu Ming Yang Sergey Tulyakov DiffM VGen 69 7 0 10 Jan 2025
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning Yuzhou Huang Ziyang Yuan Quande Liu Qiulin Wang Xintao Wang Ruimao Zhang Pengfei Wan Di Zhang Kun Gai VGen DiffM 35 10 0 08 Jan 2025
ACE++: Instruction-Based Image Creation and Editing via Context-Aware Content Filling Chaojie Mao J. Zhang Yulin Pan Zeyinzi Jiang Zhen Han Yu Liu Jingren Zhou DiffM 34 15 0 05 Jan 2025
SlerpFace: Face Template Protection via Spherical Linear Interpolation Zhizhou Zhong Yuxi Mi Y. Huang Jianqing Xu Guodong Mu Shouhong Ding Jingyun Zhang Rizen Guo Yunsheng Wu Shuigeng Zhou AAML PICV 80 5 0 03 Jan 2025
RealCustom++: Representing Images as Real-Word for Real-Time Customization Zhendong Mao Mengqi Huang Fei Ding Mingcong Liu Qian He Xiaojun Chang DiffM 60 6 0 03 Jan 2025
ConsistentID: Portrait Generation with Multimodal Fine-Grained Identity Preserving Jiehui Huang Xiao Dong Wenhui Song Zheng Chong Jun Zhou ... Long Chen Hanhui Li Yiqiang Yan Shengcai Liao Xiaodan Liang DiffM 50 19 0 31 Dec 2024
F-Bench: Rethinking Human Preference Evaluation Metrics for Benchmarking Face Generation, Customization, and Restoration Lu Liu Huiyu Duan Qiang Hu Liu Yang Chunlei Cai Tianxiao Ye Huayu Liu Xiaoyun Zhang Guangtao Zhai EGVM 92 1 0 17 Dec 2024
ColorFlow: Retrieval-Augmented Image Sequence Colorization Junhao Zhuang Xuan Ju Z. Zhang Yong-Jin Liu Shiyi Zhang Chun Yuan Ying Shan DiffM 95 1 0 16 Dec 2024
SerialGen: Personalized Image Generation by First Standardization Then Personalization Cong Xie Han Zou Ruiqi Yu Yan Zhang Zhenpeng Zhan 64 1 0 02 Dec 2024
EmojiDiff: Advanced Facial Expression Control with High Identity Preservation in Portrait Generation Liangwei Jiang Ruida Li Zhifeng Zhang Shuo Fang Chenguang Ma DiffM 72 1 0 02 Dec 2024
Fusion is all you need: Face Fusion for Customized Identity-Preserving Image Synthesis Salaheldin Mohamed Dong Han Yong Li 11 1 0 27 Sep 2024
Imagine yourself: Tuning-Free Personalized Image Generation Zecheng He Bo Sun Felix Juefei-Xu Haoyu Ma Ankit Ramchandani ... Ning Zhang Peizhao Zhang Roshan Sumbaly Peter Vajda Animesh Sinha DiffM 18 16 0 20 Sep 2024
GroundingBooth: Grounding Text-to-Image Customization Zhexiao Xiong Wei Xiong Jing Shi He Zhang Yizhi Song Nathan Jacobs DiffM 52 6 0 13 Sep 2024
Vec2Face: Scaling Face Dataset Generation with Loosely Constrained Vectors Haiyu Wu Jaskirat Singh Sicong Tian Liang Zheng Kevin W. Bowyer CVBM 42 3 0 04 Sep 2024
CatVTON: Concatenation Is All You Need for Virtual Try-On with Diffusion Models Zheng Chong Xiao Dong Haoxiang Li Shiyue Zhang Wenqing Zhang Xujie Zhang Hanqing Zhao D. Jiang Xiaodan Liang DiffM 48 17 0 21 Jul 2024
GlyphDraw2: Automatic Generation of Complex Glyph Posters with Diffusion Models and Large Language Models Jian Ma Yonglin Deng Chen Chen H. Lu Zhenyu Yang Zhenyu Yang VLM DiffM 82 6 0 02 Jul 2024
Character-Adapter: Prompt-Guided Region Control for High-Fidelity Character Customization Yuhang Ma Wenting Xu Jiji Tang Qinfeng Jin Rongsheng Zhang Zeng Zhao Changjie Fan Zhipeng Hu 26 6 0 24 Jun 2024
DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation Yuang Peng Yuxin Cui Haomiao Tang Zekun Qi Runpei Dong Jing Bai Chunrui Han Zheng Ge Xiangyu Zhang Shu-Tao Xia EGVM 69 30 0 24 Jun 2024
MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance X. Wang Siming Fu Qihan Huang Wanggui He Hao Jiang DiffM 34 40 0 11 Jun 2024
Inv-Adapter: ID Customization Generation via Image Inversion and Lightweight Adapter Peng-Fei Xing Ning Wang Jianbo Ouyang Zechao Li DiffM 34 1 0 05 Jun 2024
ID-to-3D: Expressive ID-guided 3D Heads via Score Distillation Sampling F. Babiloni Alexandros Lattas Jiankang Deng S. Zafeiriou DiffM 31 4 0 26 May 2024
Face Adapter for Pre-Trained Diffusion Models with Fine-Grained ID and Attribute Control Yue Han Junwei Zhu Keke He Xu Chen Yanhao Ge Wei Li Xiangtai Li Jiangning Zhang Chengjie Wang Yong Liu DiffM 45 25 0 21 May 2024
A Survey on Personalized Content Synthesis with Diffusion Models Xu-Lu Zhang Xiao Wei Wengyu Zhang Jinlin Wu Zhaoxiang Zhang Zhen Lei Qing Li Zhen Lei Qing Li EGVM 128 18 0 09 May 2024
StoryDiffusion: Consistent Self-Attention for Long-Range Image and Video Generation Yupeng Zhou Daquan Zhou Ming-Ming Cheng Jiashi Feng Qibin Hou DiffM VGen 27 86 0 02 May 2024
Hide and Seek: How Does Watermarking Impact Face Recognition? Yuguang Yao Steven Grosz Sijia Liu Anil K. Jain 32 1 0 29 Apr 2024
MultiBooth: Towards Generating All Your Concepts in an Image from Text Chenyang Zhu Kai Li Yue Ma Chunming He Li Xiu DiffM 95 22 0 22 Apr 2024
Universal Fingerprint Generation: Controllable Diffusion Model with Multimodal Conditions Steven A. Grosz Anil K. Jain 32 2 0 21 Apr 2024
DiffusionAct: Controllable Diffusion Autoencoder for One-shot Face Reenactment Stella Bounareli Christos Tzelepis Vasileios Argyriou Ioannis Patras Georgios Tzimiropoulos DiffM 35 7 0 25 Mar 2024
Stable-Makeup: When Real-World Makeup Transfer Meets Diffusion Model Yuxuan Zhang Lifu Wei Qing Zhang Yiren Song DiffM 28 12 0 12 Mar 2024
Enhancing Detail Preservation for Customized Text-to-Image Generation: A Regularization-Free Approach Yufan Zhou Ruiyi Zhang Tongfei Sun Jinhui Xu DiffM 99 36 0 23 May 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
General Facial Representation Learning in a Visual-Linguistic Manner Yinglin Zheng Hao Yang Ting Zhang Jianmin Bao Dongdong Chen Yangyu Huang Lu Yuan Dong Chen Ming Zeng Fang Wen CVBM 132 161 0 06 Dec 2021
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 229 74,467 0 18 May 2015