High-Resolution Image Synthesis with Latent Diffusion Models

20 December 2021

Papers citing "High-Resolution Image Synthesis with Latent Diffusion Models"

50 / 8,115 papers shown

Title
From Fragment to One Piece: A Survey on AI-Driven Graphic Design Xingxing Zou Wen Zhang Nanxuan Zhao 54 0 0 24 Mar 2025
Generative Dataset Distillation using Min-Max Diffusion Model Junqiao Fan Yunjiao Zhou Min Chang Jordan Ren Jianfei Yang DiffM 63 0 0 24 Mar 2025
Diff-Palm: Realistic Palmprint Generation with Polynomial Creases and Intra-Class Variation Controllable Diffusion Models Jianlong Jin Chenglong Zhao Ruixin Zhang Sheng Shang Jianqing Xu ... Shaoming Wang Yang Zhao Shouhong Ding Wei Jia Yunsheng Wu 158 0 0 24 Mar 2025
Aether: Geometric-Aware Unified World Modeling Aether Team Haoyi Zhu Y. Wang Jianjun Zhou Wenzheng Chang ... Zizun Li Junyi Chen Chunhua Shen Jiangmiao Pang Tong He DiffM VGen 62 2 0 24 Mar 2025
MIRAGE: Multimodal Immersive Reasoning and Guided Exploration for Red-Team Jailbreak Attacks Wenhao You Bryan Hooi Yiwei Wang Y. Wang Zong Ke Ming Yang Zi Huang Yujun Cai AAML 56 0 0 24 Mar 2025
DiffV2IR: Visible-to-Infrared Diffusion Model via Vision-Language Understanding Lingyan Ran Lidong Wang Guangcong Wang Peng Wang Y. Zhang 54 0 0 24 Mar 2025
Human Motion Unlearning Edoardo De Matteis Matteo Migliarini Alessio Sampieri Indro Spinelli Fabio Galasso MU 55 0 0 24 Mar 2025
InPO: Inversion Preference Optimization with Reparametrized DDIM for Efficient Diffusion Model Alignment Y. Lu Qichao Wang H. Cao Xierui Wang Xiaoyin Xu Min Zhang 61 0 0 24 Mar 2025
Compositional Caching for Training-free Open-vocabulary Attribute Detection Marco Garosi Alessandro Conti Gaowen Liu Elisa Ricci Massimiliano Mancini ObjD VLM 50 0 0 24 Mar 2025
DisentTalk: Cross-lingual Talking Face Generation via Semantic Disentangled Diffusion Model Kangwei Liu Junwu Liu Yun Cao Jinlin Guo Xiaowei Yi DiffM 41 0 0 24 Mar 2025
EvAnimate: Event-conditioned Image-to-Video Generation for Human Animation Qiang Qu Ming Li Xiaoming Chen Tongliang Liu DiffM VGen 63 0 0 24 Mar 2025
Boosting Resolution Generalization of Diffusion Transformers with Randomized Positional Encodings Cong Liu Liang Hou Mingwu Zheng Xin Tao Pengfei Wan Di Zhang Kun Gai 49 0 0 24 Mar 2025
Target-Aware Video Diffusion Models Taeksoo Kim Hanbyul Joo DiffM VGen 91 1 0 24 Mar 2025
RomanTex: Decoupling 3D-aware Rotary Positional Embedded Multi-Attention Network for Texture Synthesis Yifei Feng M. Yang S. M. I. Simon X. Yang Sheng Zhang J. Yu Zibo Zhao Yuhong Liu Jie Jiang Chunchao Guo DiffM 58 0 0 24 Mar 2025
CO-SPY: Combining Semantic and Pixel Features to Detect Synthetic Images by AI Siyuan Cheng Lingjuan Lyu Zhenting Wang X. Zhang Vikash Sehwag 40 0 0 24 Mar 2025
Diffusion-4K: Ultra-High-Resolution Image Synthesis with Latent Diffusion Models Jinjin Zhang Qiuyu Huang Junjie Liu Xiefan Guo Di Huang 54 1 0 24 Mar 2025
PALATE: Peculiar Application of the Law of Total Expectation to Enhance the Evaluation of Deep Generative Models Tadeusz Dziarmaga Marcin Kądziołka Artur Kasymov Marcin Mazur EGVM 100 0 0 24 Mar 2025
U-REPA: Aligning Diffusion U-Nets to ViTs Yuchuan Tian Hanting Chen Mengyu Zheng Yuchen Liang Chao Xu Yunhe Wang 56 0 0 24 Mar 2025
Video-T1: Test-Time Scaling for Video Generation F. Liu Hanyang Wang Yimo Cai Kaiyan Zhang Xiaohang Zhan Yueqi Duan DiffM VGen 76 1 0 24 Mar 2025
HunyuanPortrait: Implicit Condition Control for Enhanced Portrait Animation Zunnan Xu Zhentao Yu Zixiang Zhou Jun Zhou Xiaoyu Jin ... Chengfei Cai Shiyu Tang Qin Lin Xiu Li Qinglin Lu DiffM VGen 91 7 0 24 Mar 2025
Color Conditional Generation with Sliced Wasserstein Guidance Alexander Lobashev Maria Larchenko Dmitry Guskov DiffM 43 0 0 24 Mar 2025
Training-free Diffusion Acceleration with Bottleneck Sampling Ye Tian Xin Xia Yuxi Ren Shanchuan Lin Xing Wang Xuefeng Xiao Yunhai Tong L. Yang Bin Cui 60 0 0 24 Mar 2025
FRESA: Feedforward Reconstruction of Personalized Skinned Avatars from Few Images Rong Wang F. Prada Ziyan Wang Zhongshi Jiang Chengxiang Yin ... Javier Romero R. Joshi Hongdong Li Jason M. Saragih Yaser Sheikh 3DH 63 1 0 24 Mar 2025
ReconDreamer++: Harmonizing Generative and Reconstructive Models for Driving Scene Representation Guosheng Zhao Xiaofeng Wang Chaojun Ni Zheng Zhu Wenkang Qin Guan Huang Xingang Wang 71 1 0 24 Mar 2025
PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos Hanxiao Jiang Hao-Yu Hsu Kaifeng Zhang Hsin-Ni Yu Shenlong Wang Yunzhu Li VGen AI4CE 45 3 0 23 Mar 2025
Model-Guardian: Protecting against Data-Free Model Stealing Using Gradient Representations and Deceptive Predictions Yunfei Yang Xiaojun Chen Yuexin Xuan Zhendong Zhao AAML 65 0 0 23 Mar 2025
Unified Geometry and Color Compression Framework for Point Clouds via Generative Diffusion Priors Tianxin Huang Gim Hee Lee 45 0 0 23 Mar 2025
Decoupling Angles and Strength in Low-rank Adaptation Massimo Bini Leander Girrbach Zeynep Akata 40 0 0 23 Mar 2025
What Time Tells Us? An Explorative Study of Time Awareness Learned from Static Images Dongheng Lin Han Hu Jianbo Jiao 46 0 0 23 Mar 2025
TransAnimate: Taming Layer Diffusion to Generate RGBA Video Xuewei Chen Zhimin Chen Yiren Song VGen 63 0 0 23 Mar 2025
Taste More, Taste Better: Diverse Data and Strong Model Boost Semi-Supervised Crowd Counting Maochen Yang Zekun Li Jian Zhang Lei Qi Yinghuan Shi 38 0 0 23 Mar 2025
TCFG: Tangential Damping Classifier-free Guidance Mingi Kwon Shin seong Kim Jaeseok Jeong. Yi Ting Hsiao Youngjung Uh DiffM 62 0 0 23 Mar 2025
Guided Diffusion for the Extension of Machine Vision to Human Visual Perception Takahiro Shindo Yui Tatsumi Taiju Watanabe Hiroshi Watanabe DiffM VLM 54 0 0 23 Mar 2025
Self-Attention Diffusion Models for Zero-Shot Biomedical Image Segmentation: Unlocking New Frontiers in Medical Imaging Abderrachid Hamrani Anuradha Godavarty MedIm 39 0 0 23 Mar 2025
OmnimatteZero: Training-free Real-time Omnimatte with Pre-trained Video Diffusion Models Dvir Samuel Matan Levy N. Darshan Gal Chechik Rami Ben-Ari DiffM 62 0 0 23 Mar 2025
Progressive Prompt Detailing for Improved Alignment in Text-to-Image Generative Models Ketan Suhaas Saichandran Xavier Thomas Prakhar Kaushik Deepti Ghadiyaram DiffM 78 0 0 22 Mar 2025
ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation Oucheng Huang Yuhang Ma Zeng Zhao Mingrui Wu Jiayi Ji Rongsheng Zhang Z. Hu Xiaoshuai Sun Rongrong Ji 43 0 0 22 Mar 2025
Towards Transformer-Based Aligned Generation with Self-Coherence Guidance Shulei Wang Wang Lin Hai Huang Hanting Wang Sihang Cai ... Tao Jin Jingyuan Chen Jiacheng Sun Jieming Zhu Zhou Zhao DiffM 55 2 0 22 Mar 2025
CODA: Repurposing Continuous VAEs for Discrete Tokenization Zeyu Liu Zanlin Ni Yeguo Hua Xin Deng Xiao Ma Cheng Zhong Gao Huang 47 0 0 22 Mar 2025
MotionDiff: Training-free Zero-shot Interactive Motion Editing via Flow-assisted Multi-view Diffusion Yikun Ma Yiqing Li Jiawei Wu Xing Luo Zhi Jin DiffM VGen 58 0 0 22 Mar 2025
Guidance Free Image Editing via Explicit Conditioning Mehdi Noroozi Alberto Gil C. P. Ramos Luca Morreale Ruchika Chavhan Malcolm Chadwick Abhinav Mehrotra Sourav Bhattacharya DiffM 56 0 0 22 Mar 2025
RefCut: Interactive Segmentation with Reference Guidance Zheng Lin Nan Zhou Chen-Xi Du Deng-Ping Fan Shi-Min Hu 51 0 0 22 Mar 2025
What's Producible May Not Be Reachable: Measuring the Steerability of Generative Models Keyon Vafa Sarah Bentley Jon M. Kleinberg S. Mullainathan 38 0 0 21 Mar 2025
Dereflection Any Image with Diffusion Priors and Diversified Data Jichen Hu Chen-Ning Yang Zanwei Zhou Jiemin Fang Xiaokang Yang Q. Tian Wei-Ming Shen 44 0 0 21 Mar 2025
UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models Fanghua Yu Jinjin Gu Jinfan Hu Zheyuan Li Chao Dong DiffM 52 0 0 21 Mar 2025
Re-HOLD: Video Hand Object Interaction Reenactment via adaptive Layout-instructed Diffusion Model Yingying Fan Quanwei Yang Kaisiyuan Wang Hang Zhou Yingying Li Haocheng Feng Errui Ding Y. Wu J. Wang DiffM 44 0 0 21 Mar 2025
FreeUV: Ground-Truth-Free Realistic Facial UV Texture Recovery via Cross-Assembly Inference Strategy Xingchao Yang Takafumi Taketomi Yuki Endo Yoshihiro Kanamori DiffM 46 0 0 21 Mar 2025
Not Only Text: Exploring Compositionality of Visual Representations in Vision-Language Models Davide Berasi Matteo Farina Massimiliano Mancini Elisa Ricci Nicola Strisciuglio CoGe 66 0 0 21 Mar 2025
HyperLoRA: Parameter-Efficient Adaptive Generation for Portrait Synthesis Mengtian Li Jinshu Chen Wanquan Feng Bingchuan Li Fei Dai Songtao Zhao Qian He 3DH 52 0 0 21 Mar 2025
Is there anything left? Measuring semantic residuals of objects removed from 3D Gaussian Splatting Simona Kocour Assia Benbihi Aikaterini Adam Torsten Sattler 3DPC 41 0 0 21 Mar 2025