PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding

7 December 2023

Ming-Ming Cheng

Ying Shan

DiffM

ArXiv PDF HTML

Papers citing "PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding"

50 / 151 papers shown

Title
Not All Parameters Matter: Masking Diffusion Models for Enhancing Generation Ability L. Wang Senmao Li Fei Yang Jianye Wang Ziheng Zhang Y. Liu Y. Wang Jian Yang DiffM 52 0 0 06 May 2025
DreamO: A Unified Framework for Image Customization Chong Mou Yanze Wu Wenxu Wu Zinan Guo Pengze Zhang ... Shaojin Wu S. Zhao Jian Andrew Zhang Qian He Xinglong Wu 44 0 0 23 Apr 2025
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians Cailin Zhuang Yaoqi Hu X. Zhang Wei Cheng Jiacheng Bao Shengqi Liu Yiying Yang Xianfang Zeng Gang Yu Ming Li 3DGS 36 0 0 21 Apr 2025
InstantCharacter: Personalize Any Characters with a Scalable Diffusion Transformer Framework Jiale Tao Yanbing Zhang Qixun Wang Yiji Cheng Haofan Wang ... Ruihuang Li Linqing Wang Chunyu Wang Qin Lin Qinglin Lu DiffM 44 1 0 16 Apr 2025
CamMimic: Zero-Shot Image To Camera Motion Personalized Video Generation Using Diffusion Models P. Guhan D. Kothandaraman Tsung-Wei Huang Guan-Ming Su Dinesh Manocha DiffM VGen 29 0 0 13 Apr 2025
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning Zhong-Yu Li Ruoyi Du Juncheng Yan Le Zhuo Zhen Li Peng Gao Zhanyu Ma Ming-Ming Cheng VLM 68 2 0 10 Apr 2025
SkyReels-A2: Compose Anything in Video Diffusion Transformers Zhengcong Fei D. Li Di Qiu J. Wang Yikun Dou ... J. Xu Mingyuan Fan Guibin Chen Yang Li Yahui Zhou DiffM VGen 63 2 0 03 Apr 2025
$A$^\text{T}$A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting$ A $^\text{T}$ A: Adaptive Transformation Agent for Text-Guided Subject-Position Variable Background Inpainting Yizhe Tang Zhimin Sun Yuzhen Du Ran Yi Guangben Lu T. Hu Luying Li Lizhuang Ma Fangyuan Zou DiffM 35 0 0 02 Apr 2025
SPF-Portrait: Towards Pure Portrait Customization with Semantic Pollution-Free Fine-tuning Xiaole Xian Zhichao Liao Qingyu Li Wenyu Qin Pengfei Wan Weicheng Xie Long Zeng L. Shen P. Feng DiffM 57 0 0 01 Apr 2025
Data Synthesis with Diverse Styles for Face Recognition via 3DMM-Guided Diffusion Yuxi Mi Zhizhou Zhong Y. Huang Qiuyang Yuan Xuan Zhao Jianqing Xu Shouhong Ding Shaoming Wang Rizen Guo Shuigeng Zhou DiffM 55 0 0 01 Apr 2025
Consistent Subject Generation via Contrastive Instantiated Concepts Lee Hsin-Ying Kelvin Chan Ming Yang DiffM 88 0 0 31 Mar 2025
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization Barış Batuhan Topal Umut Özyurt Zafer Doğan Budak Ramazan Gokberk Cinbis 35 0 0 28 Mar 2025
Follow Your Motion: A Generic Temporal Consistency Portrait Editing Framework with Trajectory Guidance Haijie Yang Z. Zhang Hao Tang Jianjun Qian Jian Yang DiffM VGen 50 0 0 28 Mar 2025
TeLL Me what you cant see Saverio Cavasin Pietro Biasetton Mattia Tamiazzo Mauro Conti Simone Milani DiffM 40 0 0 25 Mar 2025
HyperLoRA: Parameter-Efficient Adaptive Generation for Portrait Synthesis Mengtian Li Jinshu Chen Wanquan Feng Bingchuan Li Fei Dai Songtao Zhao Qian He 3DH 49 0 0 21 Mar 2025
PVChat: Personalized Video Chat with One-Shot Learning Yufei Shi Weilong Yan Gang Xu Yumeng Li Y. Li Z. Li Fei Richard Yu Ming Li Si Yong Yeo 43 0 0 21 Mar 2025
Single Image Iterative Subject-driven Generation and Editing Yair Shpitzer Gal Chechik Idan Schwartz 40 0 0 20 Mar 2025
InfiniteYou: Flexible Photo Recrafting While Preserving Your Identity Liming Jiang Qing Yan Yumin Jia Zichuan Liu Hao Kang Xin Lu 38 1 0 20 Mar 2025
LaPIG: Cross-Modal Generation of Paired Thermal and Visible Facial Images Leyang Wang Joice Lin DiffM 55 0 0 20 Mar 2025
Visual Persona: Foundation Model for Full-Body Human Customization Jisu Nam Soowon Son Zhan Xu Jing Shi Difan Liu Feng Liu Aashish Misraa Seungryong Kim Yang Zhou DiffM 37 0 0 19 Mar 2025
Diffusion-based Facial Aesthetics Enhancement with 3D Structure Guidance Lisha Li Jingwen Hou Weide Liu Yuming Fang Jiebin Yan DiffM 47 1 0 18 Mar 2025
A Comprehensive Survey on Visual Concept Mining in Text-to-image Diffusion Models Ziqiang Li Jun Li Lizhi Xiong Zhangjie Fu Zechao Li VLM 50 0 0 17 Mar 2025
MagicID: Hybrid Preference Optimization for ID-Consistent and Dynamic-Preserved Video Customization Hengjia Li Lifan Jiang Xi Xiao Tianyang Wang Hongwei Yi Boxi Wu D. Cai VGen 41 0 0 16 Mar 2025
Personalize Anything for Free with Diffusion Transformer Haoran Feng Zehuan Huang Lin Li Hairong Lv Lu Sheng DiffM 68 1 0 16 Mar 2025
EditID: Training-Free Editable ID Customization for Text-to-Image Generation Guandong Li Zhaobin Chu DiffM 55 0 0 16 Mar 2025
UniVG: A Generalist Diffusion Model for Unified Image Generation and Editing Tsu-jui Fu Yusu Qian Chen Chen Wenze Hu Zhe Gan Y. Yang 85 1 0 16 Mar 2025
GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior Zichen Tang Yuan Yao Miaomiao Cui Liefeng Bo Hongyu Yang 3DGS DiffM 44 0 0 14 Mar 2025
ConceptGuard: Continual Personalized Text-to-Image Generation with Forgetting and Confusion Mitigation Zirun Guo Tao Jin DiffM 38 0 0 13 Mar 2025
Proxy-Tuning: Tailoring Multimodal Autoregressive Models for Subject-Driven Image Generation Yi Wu Lingting Zhu Lei Liu Wandi Qiao Ziqiang Li Lequan Yu Bin Li DiffM 47 0 0 13 Mar 2025
Adv-CPG: A Customized Portrait Generation Framework with Facial Adversarial Attacks Junying Wang Hongyuan Zhang Yuan Yuan AAML PICV 80 0 0 11 Mar 2025
FaceID-6M: A Large-Scale, Open-Source FaceID Customization Dataset Shuhe Wang Xiaoya Li Jiwei Li G. Wang Xiaofei Sun ... Han Qiu Mo Yu Shengjie Shen Tianwei Zhang Eduard H. Hovy VLM 58 0 0 10 Mar 2025
DynamicID: Zero-Shot Multi-ID Image Personalization with Flexible Facial Editability Xirui Hu Jiahao Wang Hao Chen Weizhan Zhang Benqi Wang Y. Li Haishun Nan DiffM 60 0 0 09 Mar 2025
VisAgent: Narrative-Preserving Story Visualization Framework Seungkwon Kim GyuTae Park Sangyeon Kim Seung-Hun Nam 38 0 0 04 Mar 2025
Personalized Generation In Large Model Era: A Survey Yiyan Xu Jinghao Zhang Alireza Salemi Xinting Hu W. Wang Fuli Feng Hamed Zamani Xiangnan He Tat-Seng Chua 3DV 71 2 0 04 Mar 2025
Fine-Grained Controllable Apparel Showcase Image Generation via Garment-Centric Outpainting Rong Zhang J. Wang Zhiwen Zuo Jianfeng Dong W. Li Chi-Yin Wang W. Xu Xun Wang DiffM 64 0 0 03 Mar 2025
Zero-Shot Head Swapping in Real-World Scenarios S. Jeong Taewoong Kang Hyojin Jang Jaegul Choo 34 0 0 02 Mar 2025
UIFace: Unleashing Inherent Model Capabilities to Enhance Intra-Class Diversity in Synthetic Face Recognition Xiao Lin Y. Huang Jianqing Xu Yuxi Mi Shuigeng Zhou Shouhong Ding 57 0 0 27 Feb 2025
LDGen: Enhancing Text-to-Image Synthesis via Large Language Model-Driven Language Representation Pengzhi Li Pengfei Yu Zide Liu Wei He Xuhao Pan Xudong Rao Tao Wei Wei Chen VLM 55 0 0 25 Feb 2025
K-LoRA: Unlocking Training-Free Fusion of Any Subject and Style LoRAs Ziheng Ouyang Zhen Li Qibin Hou MoMe OffRL 78 2 0 25 Feb 2025
DP-Adapter: Dual-Pathway Adapter for Boosting Fidelity and Text Consistency in Customizable Human Image Generation Ye Wang Xuping Xie Lanjun Wang Zili Yi Rui Ma DiffM 89 0 0 21 Feb 2025
PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation Ziyan Wang Sizhe Wei Xiaoming Huo Hao Wang DiffM 95 0 0 20 Feb 2025
I Think, Therefore I Diffuse: Enabling Multimodal In-Context Reasoning in Diffusion Models Zhenxing Mi Kuan-Chieh Jackson Wang Guocheng Qian Hanrong Ye Runtao Liu Sergey Tulyakov Kfir Aberman Dan Xu LRM 42 0 0 12 Feb 2025
SliderSpace: Decomposing the Visual Capabilities of Diffusion Models Rohit Gandikota Zongze Wu Richard Zhang David Bau Eli Shechtman Nick Kolkin DiffM 45 1 0 03 Feb 2025
Turn That Frown Upside Down: FaceID Customization via Cross-Training Data Shuhe Wang Xiaoya Li Xiaofei Sun G. Wang Tianwei Zhang Jiwei Li Eduard H. Hovy 31 0 0 28 Jan 2025
Multi-subject Open-set Personalization in Video Generation Tsai-Shien Chen Aliaksandr Siarohin Willi Menapace Yuwei Fang Kwot Sin Lee Ivan Skorokhodov Kfir Aberman Jun-Yan Zhu Ming Yang Sergey Tulyakov DiffM VGen 65 7 0 10 Jan 2025
ConceptMaster: Multi-Concept Video Customization on Diffusion Transformer Models Without Test-Time Tuning Yuzhou Huang Ziyang Yuan Quande Liu Qiulin Wang Xintao Wang Ruimao Zhang Pengfei Wan Di Zhang Kun Gai VGen DiffM 35 10 0 08 Jan 2025
RealCustom++: Representing Images as Real-Word for Real-Time Customization Zhendong Mao Mengqi Huang Fei Ding Mingcong Liu Qian He Xiaojun Chang DiffM 58 6 0 03 Jan 2025
Nested Attention: Semantic-aware Attention Values for Concept Personalization Or Patashnik Rinon Gal Daniil Ostashev Sergey Tulyakov Kfir Aberman Daniel Cohen-Or DiffM 25 5 0 03 Jan 2025
FaceSpeak: Expressive and High-Quality Speech Synthesis from Human Portraits of Different Styles Tian-Hao Zhang Jiawei Zhang J. Wang Xinyuan Qian Xu-cheng Yin CVBM 43 0 0 02 Jan 2025
ConsistentID: Portrait Generation with Multimodal Fine-Grained Identity Preserving Jiehui Huang Xiao Dong Wenhui Song Zheng Chong Jun Zhou ... Long Chen Hanhui Li Yiqiang Yan Shengcai Liao Xiaodan Liang DiffM 50 19 0 31 Dec 2024