High-Resolution Image Synthesis with Latent Diffusion Models

20 December 2021

Papers citing "High-Resolution Image Synthesis with Latent Diffusion Models"

50 / 7,853 papers shown

Title
Generative AI for Film Creation: A Survey of Recent Advances Ruihan Zhang Borou Yu Jiajian Min Yetong Xin Zheng Wei ... Sijia Jiang Peiwen Huang Na Chen Xuanxuan Liu Anyi Rao VGen 57 0 0 11 Apr 2025
DiverseFlow: Sample-Efficient Diverse Mode Coverage in Flows Mashrur M. Morshed Vishnu Boddeti 33 0 0 10 Apr 2025
ID-Booth: Identity-consistent Face Generation with Diffusion Models Darian Tomašević Fadi Boutros Chenhao Lin Naser Damer Vitomir Štruc Peter Peer DiffM 55 1 0 10 Apr 2025
Diffusion Transformers for Tabular Data Time Series Generation Fabrizio Garuti E. Sangineto Simone Luetto L. Forni Rita Cucchiara 57 0 0 10 Apr 2025
GPT Carry-On: Training Foundation Model for Customization Could Be Simple, Scalable and Affordable Jianqiao Wangni 21 0 0 10 Apr 2025
Beyond the Frame: Generating 360° Panoramic Videos from Perspective Videos Rundong Luo Matthew Wallingford Ali Farhadi Noah Snavely Wei-Chiu Ma VGen 19 0 0 10 Apr 2025
PixelFlow: Pixel-Space Generative Models with Flow Shoufa Chen Chongjian Ge Shilong Zhang Peize Sun Ping Luo VLM DRL 33 0 0 10 Apr 2025
POEM: Precise Object-level Editing via MLLM control Marco Schouten Mehmet Onurcan Kaya Serge Belongie Dim P. Papadopoulos DiffM 73 0 0 10 Apr 2025
ContrastiveGaussian: High-Fidelity 3D Generation with Contrastive Learning and Gaussian Splatting J. H. Liu Enpei Huang Dongxing Mao Hui Zhang Xinyuan Song Yongxin Ni 3DGS 50 0 0 10 Apr 2025
Revisiting Likelihood-Based Out-of-Distribution Detection by Modeling Representations Yifan Ding Arturas Aleksandrauskas Amirhossein Ahmadian Jonas Unger Fredrik Lindsten Gabriel Eilertsen OODD 30 1 0 10 Apr 2025
Gen3DEval: Using vLLMs for Automatic Evaluation of Generated 3D Objects Shalini Maiti Lourdes Agapito Filippos Kokkinos 40 0 0 10 Apr 2025
Marmot: Multi-Agent Reasoning for Multi-Object Self-Correcting in Improving Image-Text Alignment Jiayang Sun H. Wang Jie Cao Huaibo Huang R. He DiffM 68 0 0 10 Apr 2025
Teaching Humans Subtle Differences with DIFFusion Mia Chiquier Orr Avrech Yossi Gandelsman Berthy T. Feng Katherine L. Bouman Carl Vondrick DiffM 46 0 0 10 Apr 2025
Model Discrepancy Learning: Synthetic Faces Detection Based on Multi-Reconstruction Qingchao Jiang Zhishuo Xu Zhiying Zhu Ning Chen Haoyue Wang Zhongjie Ba 31 0 0 10 Apr 2025
Learning Object Focused Attention Vivek Trivedy A. Almalki Longin Jan Latecki 31 0 0 10 Apr 2025
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation Linyan Huang Haonan Lin Yanning Zhou Kaiwen Xiao 42 0 0 10 Apr 2025
GenEAva: Generating Cartoon Avatars with Fine-Grained Facial Expressions from Realistic Diffusion-based Faces Hao Yu Rupayan Mallick Margrit Betke Sarah Adel Bargal DiffM 45 0 0 10 Apr 2025
Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction Zeren Jiang Chuanxia Zheng Iro Laina Diane Larlus Andrea Vedaldi VGen 41 0 0 10 Apr 2025
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning Zhong-Yu Li Ruoyi Du Juncheng Yan Le Zhuo Zhen Li Peng Gao Zhanyu Ma Ming-Ming Cheng VLM 68 2 0 10 Apr 2025
A Meaningful Perturbation Metric for Evaluating Explainability Methods Danielle Cohen Hila Chefer Lior Wolf AAML 25 0 0 09 Apr 2025
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography Mengchen Zhang Tong Wu Jing Tan Ziwei Liu Gordon Wetzstein D. Lin VGen 21 0 0 09 Apr 2025
PathSegDiff: Pathology Segmentation using Diffusion model representations Sachin Kumar Danisetty Alexandros Graikos Srikar Yellapragada Dimitris Samaras MedIm 19 0 0 09 Apr 2025
Distilling Textual Priors from LLM to Efficient Image Fusion Ran Zhang Xuanhua He Ke Cao L. Liu Li Zhang Man Zhou Jie Zhang 21 0 0 09 Apr 2025
RAGME: Retrieval Augmented Video Generation for Enhanced Motion Realism E. Peruzzo Dejia Xu Xingqian Xu Humphrey Shi N. Sebe DiffM VGen 54 0 0 09 Apr 2025
Latent Diffusion U-Net Representations Contain Positional Embeddings and Anomalies Jonas Loos Lorenz Linhardt 26 0 0 09 Apr 2025
MoEDiff-SR: Mixture of Experts-Guided Diffusion Model for Region-Adaptive MRI Super-Resolution Zhe Wang Yuhua Ru A. Chetouani Fang Chen Fabian Bauer Liping Zhang Didier Hans Rachid Jennane M. Jarraya Yung Hsin Chen DiffM MedIm 18 0 0 09 Apr 2025
Are We Done with Object-Centric Learning? Alexander Rubinstein Ameya Prabhu Matthias Bethge Seong Joon Oh OCL 556 0 0 09 Apr 2025
Compass Control: Multi Object Orientation Control for Text-to-Image Generation Rishubh Parihar Vaibhav Agrawal Sachidanand VS R. V. Babu DiffM 28 0 0 09 Apr 2025
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation Emmanuelle Bourigault A. Jamaludin Abdullah Hamdi 26 0 0 09 Apr 2025
MonoPlace3D: Learning 3D-Aware Object Placement for 3D Monocular Detection Rishubh Parihar Srinjay Sarkar Sarthak Vora Jogendra Nath Kundu R. V. Babu 50 0 0 09 Apr 2025
CasTex: Cascaded Text-to-Texture Synthesis via Explicit Texture Maps and Physically-Based Shading Mishan Aliev Dmitry Baranchuk Kirill Struminsky DiffM 28 0 0 09 Apr 2025
FlashDepth: Real-time Streaming Video Depth Estimation at 2K Resolution Gene Chou Wenqi Xian Guandao Yang Mohamed Abdelfattah Bharath Hariharan Noah Snavely Ning Yu P. Debevec MDE 27 0 0 09 Apr 2025
MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs Jiawei Mao Y. Wang Yucheng Tang Daguang Xu Kang Wang Yang Yang Zongwei Zhou Yuyin Zhou MedIm 22 0 0 09 Apr 2025
DyDiT++: Dynamic Diffusion Transformers for Efficient Visual Generation Wangbo Zhao Yizeng Han Jiasheng Tang Kai Wang Hao Luo Yibing Song Gao Huang Fan Wang Yang You 66 0 0 09 Apr 2025
Detecting AI-generated Artwork Meien Li Mark Stamp 19 0 0 09 Apr 2025
SafeMLRM: Demystifying Safety in Multi-modal Large Reasoning Models Junfeng Fang Y. Wang Ruipeng Wang Zijun Yao Kun Wang An Zhang X. Wang Tat-Seng Chua AAML LRM 60 3 0 09 Apr 2025
Probability Density Geodesics in Image Diffusion Latent Space Qingtao Yu Jaskirat Singh Zhaoyuan Yang Peter Tu Jing Zhang Hongdong Li Richard Hartley Dylan Campbell DiffM 60 0 0 09 Apr 2025
EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation Diljeet Jagpal Xi Chen Vinay P. Namboodiri DiffM VGen 46 0 0 09 Apr 2025
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering Y. Gao Zihang Lin Chuanbin Liu Min Zhou T. Ge Bo Zheng Hongtao Xie DiffM 35 0 0 09 Apr 2025
MESA: Text-Driven Terrain Generation Using Latent Diffusion and Global Copernicus Data Paul Borne--Pons Mikolaj Czerkawski Rosalie Martin Romain Rouffet DiffM 19 2 0 09 Apr 2025
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding Pedro Hermosilla Christian Stippel Leon Sick SSL 3DPC 74 0 0 09 Apr 2025
Measuring Déjà vu Memorization Efficiently Narine Kokhlikyan Bargav Jayaraman Florian Bordes Chuan Guo Kamalika Chaudhuri 23 1 0 08 Apr 2025
D-Feat Occlusions: Diffusion Features for Robustness to Partial Visual Occlusions in Object Recognition Rupayan Mallick Sibo Dong Nataniel Ruiz Sarah Adel Bargal DiffM 44 0 0 08 Apr 2025
CamContextI2V: Context-aware Controllable Video Generation Luis Denninger Sina Mokhtarzadeh Azar Juergen Gall VGen 33 0 0 08 Apr 2025
Mind the Trojan Horse: Image Prompt Adapter Enabling Scalable and Deceptive Jailbreaking Junxi Chen Junhao Dong Xiaohua Xie 33 0 0 08 Apr 2025
OmniSVG: A Unified Scalable Vector Graphics Generation Model Yiying Yang Wei Cheng Sijin Chen Xianfang Zeng Jiaxu Zhang Liao Wang Gang Yu Xingjun Ma Yu Jiang VLM 40 0 0 08 Apr 2025
Releasing Differentially Private Event Logs Using Generative Models Frederik Wangelik Majid Rafiei M. Pourbafrani Wil M.P. van der Aalst 21 0 0 08 Apr 2025
Storybooth: Training-free Multi-Subject Consistency for Improved Visual Storytelling Jaskirat Singh Junshen Kevin Chen Jonas Kohler Michael Cohen DiffM VGen 35 0 0 08 Apr 2025
Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model Qi Mao L. Chen Yuchao Gu Mike Zheng Shou Ming-Hsuan Yang DiffM 39 0 0 08 Apr 2025
Reconstruction-Free Anomaly Detection with Diffusion Models via Direct Latent Likelihood Evaluation Shunsuke Sakai Tatsuhito Hasegawa 26 0 0 08 Apr 2025