High-Resolution Image Synthesis with Latent Diffusion Models

20 December 2021

Papers citing "High-Resolution Image Synthesis with Latent Diffusion Models"

50 / 7,833 papers shown

Title
SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models Wufei Ma Luoxin Ye Nessa McWeeney Celso M de Melo A. Yuille Jieneng Chen LRM 57 1 0 01 May 2025
CoCoDiff: Diversifying Skeleton Action Features via Coarse-Fine Text-Co-Guided Latent Diffusion Zhifu Zhao Hanyang Hua J. Li Shaoxin Wu Fu Li Yangtao Zhou Yang Li DiffM 68 0 0 30 Apr 2025
Revisiting Diffusion Autoencoder Training for Image Reconstruction Quality Pramook Khungurn Sukit Seripanitkarn Phonphrm Thawatdamrongkit Supasorn Suwajanakorn DiffM 68 0 0 30 Apr 2025
Sparse-to-Sparse Training of Diffusion Models Inês Cardoso Oliveira Decebal Constantin Mocanu Luis A. Leiva DiffM 78 0 0 30 Apr 2025
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields Yixin Gao Xiaohan Pan X. Li Zhibo Chen 51 0 0 30 Apr 2025
ReVision: High-Quality, Low-Cost Video Generation with Explicit 3D Physics Modeling for Complex Motion and Interaction Qihao Liu Ju He Qihang Yu Liang-Chieh Chen Alan Yuille DiffM VGen 75 0 0 30 Apr 2025
Text-Conditioned Diffusion Model for High-Fidelity Korean Font Generation Abdul Sami Avinash Kumar Irfanullah Memon Youngwon Jo Muhammad Rizwan Jaeyoung Choi DiffM 37 0 0 30 Apr 2025
GarmentDiffusion: 3D Garment Sewing Pattern Generation with Multimodal Diffusion Transformers Xinyu Li Qi Yao Y. Wang DiffM 41 0 0 30 Apr 2025
AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images Yunhao Li Sijing Wu Wei Sun Zhichao Zhang Yucheng Zhu Zicheng Zhang Huiyu Duan Xiongkuo Min Guangtao Zhai EGVM 78 0 0 30 Apr 2025
MagicPortrait: Temporally Consistent Face Reenactment with 3D Geometric Guidance Mengting Wei Yante Li Tuomas Varanka Yan Jiang Licai Sun DiffM VGen 62 0 0 30 Apr 2025
The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning Siyi Chen Yimeng Zhang Sijia Liu Q. Qu AAML 55 0 0 30 Apr 2025
IDDM: Bridging Synthetic-to-Real Domain Gap from Physics-Guided Diffusion for Real-world Image Dehazing Shijun Zhou Y. Liu Chunhui Hao Zhiyuan Liu Jiandong Tian DiffM 31 0 0 30 Apr 2025
Common3D: Self-Supervised Learning of 3D Morphable Models for Common Objects in Neural Feature Space Leonhard Sommer Olaf Dünkel Christian Theobalt Adam Kortylewski 24 0 0 30 Apr 2025
Visual Text Processing: A Comprehensive Review and Unified Evaluation Yan Shu Weichao Zeng Fangmin Zhao Zeyu Chen Z. Li ... Paolo Rota Xiang Bai Lianwen Jin Xu-Cheng Yin N. Sebe CoGe 52 0 0 30 Apr 2025
Can We Achieve Efficient Diffusion without Self-Attention? Distilling Self-Attention into Convolutions Ziyi Dong Chengxing Zhou Weijian Deng Pengxu Wei Xiangyang Ji Liang Lin MQ 41 0 0 30 Apr 2025
Diff-Prompt: Diffusion-Driven Prompt Generator with Mask Supervision Weicai Yan Wang Lin Zirun Guo Ye Wang Fangming Feng Xiaoda Yang Z. Wang Tao Jin DiffM 88 2 0 30 Apr 2025
PRISM-DP: Spatial Pose-based Observations for Diffusion-Policies via Segmentation, Mesh Generation, and Pose Tracking Xiatao Sun Yinxing Chen Daniel Rakita VGen 53 0 0 29 Apr 2025
TrueFake: A Real World Case Dataset of Last Generation Fake Images also Shared on Social Networks S. Dell’Anna Andrea Montibeller Giulia Boato 54 0 0 29 Apr 2025
T2ID-CAS: Diffusion Model and Class Aware Sampling to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection Manikanta Varaganti Amulya Vankayalapati Nour Awad Gregory R. Dion Laura J. Brattain DiffM MedIm 64 0 0 29 Apr 2025
ADiff4TPP: Asynchronous Diffusion Models for Temporal Point Processes Amartya Mukherjee Ruizhi Deng He Zhao Yuzhen Mao Leonid Sigal Frederick Tung DiffM AI4TS 49 0 0 29 Apr 2025
TriniMark: A Robust Generative Speech Watermarking Method for Trinity-Level Attribution Yue Li W. Liu Dongdong Lin 37 0 0 29 Apr 2025
Evaluating Generative Models for Tabular Data: Novel Metrics and Benchmarking Dayananda Herurkar Ahmad Ali Andreas Dengel 38 0 0 29 Apr 2025
Erased but Not Forgotten: How Backdoors Compromise Concept Erasure Jonas Henry Grebe Tobias Braun Marcus Rohrbach Anna Rohrbach AAML 75 0 0 29 Apr 2025
YoChameleon: Personalized Vision and Language Generation Thao Nguyen Krishna Kumar Singh Jing Shi Trung H. Bui Yong Jae Lee Yuheng Li MLLM 82 0 0 29 Apr 2025
LDPoly: Latent Diffusion for Polygonal Road Outline Extraction in Large-Scale Topographic Mapping Weiqin Jiao Hao Cheng G. Vosselman Claudio Persello 76 0 0 29 Apr 2025
X-Fusion: Introducing New Modality to Frozen Large Language Models Sicheng Mo Thao Nguyen Xun Huang Siddharth Srinivasan Iyer Yijun Li ... Eli Shechtman Krishna Kumar Singh Yong Jae Lee Bolei Zhou Yuheng Li 71 0 0 29 Apr 2025
Creating Your Editable 3D Photorealistic Avatar with Tetrahedron-constrained Gaussian Splatting Hanxi Liu Yifang Men Zhouhui Lian 3DGS 33 0 0 29 Apr 2025
A Picture is Worth a Thousand Prompts? Efficacy of Iterative Human-Driven Prompt Refinement in Image Regeneration Tasks Khoi Trinh S. Seidenberger Raveen Wijewickrama Murtuza Jadliwala Anindya Maiti 41 0 0 29 Apr 2025
FedMVP: Federated Multi-modal Visual Prompt Tuning for Vision-Language Models Mainak Singha Subhankar Roy Sarthak Mehrotra Ankit Jha Moloud Abdar Biplab Banerjee Elisa Ricci VLM VPVLM 108 0 0 29 Apr 2025
Generative Diffusion Models for Resource Allocation in Wireless Networks Yigit Berkay Uslu Samar Hadou Shirin Saeedi Bidokhti Alejandro Ribeiro DiffM 33 0 0 28 Apr 2025
A Platform for Generating Educational Activities to Teach English as a Second Language Aiala Rosá Santiago Góngora Juan Pablo Filevich Ignacio Sastre Laura Musto Brian Carpenter Luis Chiruzzo AI4Ed 46 0 0 28 Apr 2025
Integration Flow Models Jingjing Wang Dan Zhang Joshua Luo Yin Yang Feng Luo 39 0 0 28 Apr 2025
EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation Zhe Dong Yuzhe Sun Tianzhu Liu Wangmeng Zuo Yanfeng Gu 48 0 0 28 Apr 2025
CompleteMe: Reference-based Human Image Completion Yu-Ju Tsai Brian L. Price Qing Liu Luis Figueroa D. Pakhomov Zhihong Ding Scott D. Cohen Ming Yang 3DH 47 0 0 28 Apr 2025
AI Alignment in Medical Imaging: Unveiling Hidden Biases Through Counterfactual Analysis Haroui Ma Francesco Quinzan Theresa Willem Stefan Bauer 71 0 0 28 Apr 2025
Physics-Informed Diffusion Models for SAR Ship Wake Generation from Text Prompts Kamirul Kamirul Odysseas A. Pappas A. Achim DiffM 40 0 0 28 Apr 2025
Open-set Anomaly Segmentation in Complex Scenarios Song Xia Yi Yu Henghui Ding Wenhan Yang S. Liu Alex C. Kot Xudong Jiang DiffM 50 0 0 28 Apr 2025
Image Interpolation with Score-based Riemannian Metrics of Diffusion Models Shinnosuke Saito Takashi Matsubara DiffM 79 1 0 28 Apr 2025
Masked Language Prompting for Generative Data Augmentation in Few-shot Fashion Style Recognition Yuki Hirakawa Ryotaro Shimizu 41 0 0 28 Apr 2025
CoherenDream: Boosting Holistic Text Coherence in 3D Generation via Multimodal Large Language Models Feedback Chenhan Jiang Yihan Zeng Hang Xu Dit-Yan Yeung 44 0 0 28 Apr 2025
ShowMak3r: Compositional TV Show Reconstruction S. Kim Seunguk Do Jaesik Park VGen 36 0 0 28 Apr 2025
RepText: Rendering Visual Text via Replicating H. Wang Y. Xu Y. Li J. Li Chaowei Zhang J. Wang Kejia Yang Z. Chen VLM 66 0 0 28 Apr 2025
WILD: a new in-the-Wild Image Linkage Dataset for synthetic image attribution Pietro Bongini S. Mandelli Andrea Montibeller Mirko Casu Orazio Pontorno ... Paolo Bestagini Irene Amerini F. D. De Natale S. Battiato Mauro Barni VLM 76 0 0 28 Apr 2025
Learning to Drive from a World Model Mitchell Goff Greg Hogan George Hotz Armand du Parc Locmaria Kacper Raczy Harald Schäfer Adeeb Shihadeh Weixing Zhang Yassine Yousfi 26 0 0 27 Apr 2025
CapsFake: A Multimodal Capsule Network for Detecting Instruction-Guided Deepfakes Tuan Nguyen Naseem Khan Issa Khalil AAML 52 0 0 27 Apr 2025
Flow Along the K-Amplitude for Generative Modeling Weitao Du Shuning Chang Jiasheng Tang Yu Rong F. Wang Shengchao Liu 44 0 0 27 Apr 2025
REED-VAE: RE-Encode Decode Training for Iterative Image Editing with Diffusion Models Gal Almog Ariel Shamir Ohad Fried DiffM 50 0 0 26 Apr 2025
CAMeL: Cross-modality Adaptive Meta-Learning for Text-based Person Retrieval Hang Yu Jiahao Wen Zhedong Zheng 41 0 0 26 Apr 2025
Global Stress Generation and Spatiotemporal Super-Resolution Physics-Informed Operator under Dynamic Loading for Two-Phase Random Materials Tengfei Xing Xiaodan Ren Jie Li DiffM 32 0 0 26 Apr 2025
Eval3D: Interpretable and Fine-grained Evaluation for 3D Generation Shivam Duggal Yushi Hu Oscar Michel Aniruddha Kembhavi William T. Freeman Noah A. Smith Ranjay Krishna Antonio Torralba Ali Farhadi Wei-Chiu Ma EGVM ELM 67 0 0 25 Apr 2025