Versatile Diffusion: Text, Images and Variations All in One Diffusion Model

15 November 2022

Papers citing "Versatile Diffusion: Text, Images and Variations All in One Diffusion Model"

50 / 139 papers shown

Title
A Versatile Diffusion Transformer with Mixture of Noise Levels for Audiovisual Generation Gwanghyun Kim Alonso Martinez Yu-Chuan Su Brendan Jou José Lezama ... Lijun Yu Lu Jiang A. Jansen Jacob Walker Krishna Somandepalli 20 8 0 22 May 2024
CuMo: Scaling Multimodal LLM with Co-Upcycled Mixture-of-Experts Jiachen Li Xinyao Wang Sijie Zhu Chia-Wen Kuo Lu Xu Fan Chen Jitesh Jain Humphrey Shi Longyin Wen MLLM MoE 28 26 0 09 May 2024
A Survey on Personalized Content Synthesis with Diffusion Models Xu-Lu Zhang Xiao Wei Wengyu Zhang Jinlin Wu Zhaoxiang Zhang Zhen Lei Qing Li Zhen Lei Qing Li EGVM 131 19 0 09 May 2024
Integration of Mixture of Experts and Multimodal Generative AI in Internet of Vehicles: A Survey Minrui Xu Dusit Niyato Jiawen Kang Zehui Xiong Abbas Jamalipour Yuguang Fang Dong In Kim Xuemin X. Shen 20 5 0 25 Apr 2024
UVMap-ID: A Controllable and Personalized UV Map Generative Model Weijie Wang Jichao Zhang Chang Liu Xia Li Xingqian Xu Humphrey Shi N. Sebe Bruno Lepri 23 2 0 22 Apr 2024
Object-Attribute Binding in Text-to-Image Generation: Evaluation and Control Maria Mihaela Truşcǎ Wolf Nuyts Jonathan Thomm Robert Honig Thomas Hofmann Tinne Tuytelaars Marie-Francine Moens 18 2 0 21 Apr 2024
LaDiC: Are Diffusion Models Really Inferior to Autoregressive Counterparts for Image-to-Text Generation? Yuchi Wang Shuhuai Ren Rundong Gao Linli Yao Qingyan Guo Kaikai An Jianhong Bai Xu Sun DiffM VLM 36 6 0 16 Apr 2024
MaxFusion: Plug&Play Multi-Modal Generation in Text-to-Image Diffusion Models Nithin Gopalakrishnan Nair Jeya Maria Jose Valanarasu Vishal M. Patel MoMe 33 7 0 15 Apr 2024
Magic Clothing: Controllable Garment-Driven Image Synthesis Weifeng Chen Tao Gu Yuhao Xu Chengcai Chen 38 16 0 15 Apr 2024
MindBridge: A Cross-Subject Brain Decoding Framework Shizun Wang Songhua Liu Zhenxiong Tan Xinchao Wang AI4CE 43 23 0 11 Apr 2024
UMBRAE: Unified Multimodal Brain Decoding Weihao Xia Raoul de Charette Cengiz Öztireli Jing-Hao Xue 29 6 0 10 Apr 2024
Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI Hugo Caselles-Dupré Charles Mellerio Paul Hérent Alizée Lopez-Persem Benoit Béranger Mathieu Soularue Pierre Fautrel Gauthier Vernier Matthieu Cord VGen MedIm DiffM 19 0 0 08 Apr 2024
Dynamic Prompt Optimizing for Text-to-Image Generation Wenyi Mo Tianyu Zhang Yalong Bai Bing-Huang Su Ji-Rong Wen Qing Yang 30 9 0 05 Apr 2024
Psychometry: An Omnifit Model for Image Reconstruction from Human Brain Activity Ruijie Quan Wenguan Wang Zhibo Tian Fan Ma Yi Yang 34 12 0 29 Mar 2024
NeuroPictor: Refining fMRI-to-Image Reconstruction via Multi-individual Pretraining and Multi-level Modulation Jingyang Huo Yikai Wang Xuelin Qian Yun Wang Chong Li Jianfeng Feng Yanwei Fu DiffM MedIm 35 8 0 27 Mar 2024
DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception Yibo Wang Ruiyuan Gao Kai Chen Kaiqiang Zhou Yingjie Cai ... Zhenguo Li Lihui Jiang Dit-Yan Yeung Qiang Xu Kai Zhang DiffM 113 21 0 20 Mar 2024
MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data Paul S. Scotti Mihir Tripathy Cesar Kadir Torrico Villanueva Reese Kneeland Tong Chen ... Charan Santhirasegaran Jonathan Xu Thomas Naselaris Kenneth A. Norman Tanishq Mathew Abraham 25 35 0 17 Mar 2024
See Through Their Minds: Learning Transferable Neural Representation from Cross-Subject fMRI Yulong Liu Yongqiang Ma Guibo Zhu Haodong Jing Nanning Zheng 14 4 0 11 Mar 2024
Controllable Generation with Text-to-Image Diffusion Models: A Survey Pu Cao Feng Zhou Qing-Huang Song Lu Yang 67 35 0 07 Mar 2024
Transparent Image Layer Diffusion using Latent Transparency Lvmin Zhang Maneesh Agrawala 29 41 0 27 Feb 2024
Diffusion Model-Based Image Editing: A Survey Yi Huang Jiancheng Huang Yifan Liu Mingfu Yan Jiaxi Lv Jianzhuang Liu Wei Xiong He Zhang Liangliang Cao Liangliang Cao EGVM 66 84 0 27 Feb 2024
Social Reward: Evaluating and Enhancing Generative AI through Million-User Feedback from an Online Creative Community Arman Isajanyan Artur Shatveryan David Kocharyan Zhangyang Wang Humphrey Shi EGVM 62 5 0 15 Feb 2024
Closed-Loop Unsupervised Representation Disentanglement with $β$ -VAE Distillation and Diffusion Probabilistic Feedback Xin Jin Bo Li Baao Xie Wenyao Zhang Jinming Liu Ziqiang Li Tao Yang Wenjun Zeng DRL DiffM CoGe 27 7 0 04 Feb 2024
Separable Multi-Concept Erasure from Diffusion Models Mengnan Zhao Lihe Zhang Tianhang Zheng Yuqiu Kong Baocai Yin 41 9 0 03 Feb 2024
CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion Nisha Huang Weiming Dong Yuxin Zhang Fan Tang Ronghui Li Chongyang Ma Xiu Li Changsheng Xu Changsheng Xu DiffM 22 7 0 25 Jan 2024
Brain-Conditional Multimodal Synthesis: A Survey and Taxonomy Weijian Mai Jian Zhang Pengfei Fang Zhijun Zhang 37 9 0 31 Dec 2023
PanGu-Draw: Advancing Resource-Efficient Text-to-Image Synthesis with Time-Decoupled Training and Reusable Coop-Diffusion Guansong Lu Yuanfan Guo Jianhua Han Minzhe Niu Yihan Zeng Songcen Xu Zeyi Huang Zhao Zhong Wei Zhang Hang Xu 26 4 0 27 Dec 2023
VCoder: Versatile Vision Encoders for Multimodal Large Language Models Jitesh Jain Jianwei Yang Humphrey Shi MLLM 11 24 0 21 Dec 2023
HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image Inpainting with Diffusion Models Hayk Manukyan Andranik Sargsyan Barsegh Atanyan Zhangyang Wang Shant Navasardyan Humphrey Shi DiffM 22 28 0 21 Dec 2023
Brain-optimized inference improves reconstructions of fMRI brain activity Reese Kneeland Jordyn Ojeda Ghislain St-Yves Thomas Naselaris AI4CE 13 5 0 12 Dec 2023
ControlNet-XS: Designing an Efficient and Effective Architecture for Controlling Text-to-Image Diffusion Models Denis Zavadski Johann-Friedrich Feiden Carsten Rother DiffM 44 10 0 11 Dec 2023
Offloading and Quality Control for AI Generated Content Services in 6G Mobile Edge Computing Networks Yi-Ting Wang Chang Liu Jun Zhao 11 1 0 11 Dec 2023
Diffusion for Natural Image Matting Yihan Hu Yiheng Lin Wei Wang Yao-Min Zhao Yunchao Wei Humphrey Shi 18 7 0 10 Dec 2023
Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models Jiayi Guo Xingqian Xu Yifan Pu Zanlin Ni Chaofei Wang Manushree Vasu Shiji Song Gao Huang Humphrey Shi DiffM 14 28 0 07 Dec 2023
SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models Yuwei Guo Ceyuan Yang Anyi Rao Maneesh Agrawala Dahua Lin Bo Dai DiffM VGen 15 113 0 28 Nov 2023
UGG: Unified Generative Grasping Jiaxin Lu Hao Kang Haoxiang Li Bo Liu Yiding Yang Qixing Huang Gang Hua 44 21 0 28 Nov 2023
Efficient Multimodal Diffusion Models Using Joint Data Infilling with Partially Shared U-Net Zizhao Hu Shaochong Jia Mohammad Rostami DiffM MedIm 11 0 0 28 Nov 2023
Gaussian Mixture Solvers for Diffusion Models Hanzhong Guo Cheng Lu Fan Bao Tianyu Pang Shuicheng Yan Chao Du Chongxuan Li 15 9 0 02 Nov 2023
Diversity and Diffusion: Observations on Synthetic Image Distributions with Stable Diffusion David Marwood S. Baluja Y. Alon DiffM 49 5 0 31 Oct 2023
Boosting Data Analytics With Synthetic Volume Expansion Xiaotong Shen Yifei Liu Rex Shen 11 3 0 27 Oct 2023
EasyGen: Easing Multimodal Generation with BiDiffuser and LLMs Xiangyu Zhao Bo Liu Qijiong Liu Guangyuan Shi Xiao-Ming Wu VLM DiffM 13 7 0 13 Oct 2023
Leveraging Diffusion-Based Image Variations for Robust Training on Poisoned Data Lukas Struppek Martin Hentschel Clifton A. Poth Dominik Hintersdorf Kristian Kersting SILM DiffM 7 4 0 10 Oct 2023
Improving Compositional Text-to-image Generation with Large Vision-Language Models Song Wen Guian Fang Renrui Zhang Peng Gao Hao Dong Dimitris N. Metaxas 16 17 0 10 Oct 2023
Perceptual Artifacts Localization for Image Synthesis Tasks Lingzhi Zhang Zhengjie Xu Connelly Barnes Yuqian Zhou Qing Liu He Zhang Sohrab Amirghodsi Zhe-nan Lin Eli Shechtman Jianbo Shi DiffM 19 21 0 09 Oct 2023
VoiceExtender: Short-utterance Text-independent Speaker Verification with Guided Diffusion Model Yayun He Zuheng Kang Jianzong Wang Junqing Peng Jing Xiao DiffM 8 2 0 07 Oct 2023
DREAM: Visual Decoding from Reversing Human Visual System Weihao Xia Raoul de Charette Cengiz Öztireli Jing-Hao Xue 8 30 0 03 Oct 2023
InstaFlow: One Step is Enough for High-Quality Diffusion-Based Text-to-Image Generation Xingchao Liu Xiwen Zhang Jianzhu Ma Jian Peng Qiang Liu 91 192 0 12 Sep 2023
Prefix-diffusion: A Lightweight Diffusion Model for Diverse Image Captioning Guisheng Liu Yi Li Zhengcong Fei Haiyan Fu Xiangyang Luo Yanqing Guo VLM DiffM 17 5 0 10 Sep 2023
MaskDiffusion: Boosting Text-to-Image Consistency with Conditional Mask Yupeng Zhou Daquan Zhou Zuo-Liang Zhu Yaxing Wang Qibin Hou Jiashi Feng 8 10 0 08 Sep 2023
Diffusion Models for Image Restoration and Enhancement -- A Comprehensive Survey Xin Li Yulin Ren Xin Jin Cuiling Lan X. Wang Wenjun Zeng Xinchao Wang Zhibo Chen 39 46 0 18 Aug 2023