Vector Quantized Diffusion Model for Text-to-Image Synthesis

29 November 2021

Jianmin Bao

Lu Yuan

Papers citing "Vector Quantized Diffusion Model for Text-to-Image Synthesis"

50 / 563 papers shown

Title
Detecting Discrepancies Between AI-Generated and Natural Images Using Uncertainty Jun Nie Yonggang Zhang Tongliang Liu Y. Cheung Bo Han Xinmei Tian UQCV 83 0 0 08 Dec 2024
Remix-DiT: Mixing Diffusion Transformers for Multi-Expert Denoising Gongfan Fang Xinyin Ma Xinchao Wang DiffM MoE 104 0 0 07 Dec 2024
CopyrightShield: Spatial Similarity Guided Backdoor Defense against Copyright Infringement in Diffusion Models Zhixiang Guo Siyuan Liang Aishan Liu Dacheng Tao AAML 66 1 0 02 Dec 2024
Multidimensional Byte Pair Encoding: Shortened Sequences for Improved Visual Data Generation Tim Elsner Paula Usinger Julius Nehring-Wirxel Gregor Kobsik Victor Czech Yanjiang He I. Lim Leif Kobbelt 32 0 0 15 Nov 2024
ColorEdit: Training-free Image-Guided Color editing with diffusion model Xingxi Yin Zhi Li Jingfeng Zhang Chenglin Li Yin Zhang DiffM 47 0 0 15 Nov 2024
Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors Anisha Pal Julia Kruk Mansi Phute Manognya Bhattaram Diyi Yang Duen Horng Chau Judy Hoffman AAML 42 2 0 12 Nov 2024
ENAT: Rethinking Spatial-temporal Interactions in Token-based Image Synthesis Zanlin Ni Yulin Wang Renping Zhou Yizeng Han Jiayi Guo Zhiyuan Liu Yuan Yao Gao Huang 50 4 0 11 Nov 2024
Scalable, Tokenization-Free Diffusion Model Architectures with Efficient Initial Convolution and Fixed-Size Reusable Structures for On-Device Image Generation Sanchar Palit Sathya Veera Reddy Dendi Mallikarjuna Talluri Raj Narayana Gadde 33 0 0 09 Nov 2024
Autoregressive Models in Vision: A Survey Jing Xiong Gongye Liu Lun Huang Chengyue Wu Taiqiang Wu ... M. Zhang Guillermo Sapiro Jiebo Luo Ping Luo Ngai Wong VGen 46 9 0 08 Nov 2024
Analyzing The Language of Visual Tokens David M. Chan Rodolfo Corona J. S. Park Cheol Jun Cho Yutong Bai Trevor Darrell 21 2 0 07 Nov 2024
Community Forensics: Using Thousands of Generators to Train Fake Image Detectors Jeongsoo Park Andrew Owens 23 3 0 06 Nov 2024
Estimating Ego-Body Pose from Doubly Sparse Egocentric Video Data Seunggeun Chi Pin-Hao Huang Enna Sachdeva Hengbo Ma Karthik Ramani Kwonjoon Lee DiffM 24 2 0 05 Nov 2024
Exploring the Interplay Between Video Generation and World Models in Autonomous Driving: A Survey Ao Fu Yi Zhou Tao Zhou Y. Yang Bojun Gao Qun Li Guobin Wu Ling Shao VGen 56 2 0 05 Nov 2024
VQ-Map: Bird's-Eye-View Map Layout Estimation in Tokenized Discrete Space via Vector Quantization Yiwei Zhang Jin Gao Fudong Ge Guan Luo Bing Li Z. Zhang Haibin Ling Weiming Hu 47 0 0 03 Nov 2024
Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model Wenjia Xie Hao Wang L. Zhang Rui Zhou Defu Lian Enhong Chen DiffM 36 3 0 31 Oct 2024
MoLE: Enhancing Human-centric Text-to-image Diffusion via Mixture of Low-rank Experts Jie Zhu Y. Chen Mingyu Ding Ping Luo Leye Wang Jingdong Wang DiffM 29 2 0 30 Oct 2024
st-DTPM: Spatial-Temporal Guided Diffusion Transformer Probabilistic Model for Delayed Scan PET Image Prediction Ran Hong Yuxia Huang Lei Liu Zhonghui Wu Bingxuan Li X. Wang Qiegen Liu MedIm 32 0 0 30 Oct 2024
Diff-Instruct*: Towards Human-Preferred One-step Text-to-image Generative Models Weijian Luo C. Zhang Debing Zhang Zhengyang Geng 26 3 0 28 Oct 2024
Novel Object Synthesis via Adaptive Text-Image Harmony Zeren Xiong Zedong Zhang Zikun Chen Shuo Chen X. Li Gan Sun Jian Yang Jun Li DiffM 32 4 0 28 Oct 2024
Human-Object Interaction Detection Collaborated with Large Relation-driven Diffusion Models Liulei Li Wenguan Wang Y. Yang 37 7 0 26 Oct 2024
Diff-Instruct++: Training One-step Text-to-image Generator Model to Align with Human Preferences Weijian Luo EGVM 36 6 0 24 Oct 2024
How to Continually Adapt Text-to-Image Diffusion Models for Flexible Customization? Jiahua Dong Wenqi Liang Hongliu Li Duzhen Zhang Meng Cao Henghui Ding Salman Khan F. Khan DiffM 49 9 0 23 Oct 2024
On conditional diffusion models for PDE simulations Aliaksandra Shysheya Cristiana-Diana Diaconu Federico Bergamin P. Perdikaris José Miguel Hernández-Lobato Richard E. Turner Emile Mathieu DiffM 23 4 0 21 Oct 2024
Synergistic Dual Spatial-aware Generation of Image-to-Text and Text-to-Image Yu Zhao Hao Fei Xiangtai Li L. Qin Jiayi Ji Hongyuan Zhu Meishan Zhang M. Zhang Jianguo Wei DiffM 26 1 0 20 Oct 2024
Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion Bac Nguyen and Chieh-Hsin Lai Yuhta Takida Naoki Murata Toshimitsu Uesaka Stefano Ermon Yuki Mitsufuji 56 0 0 18 Oct 2024
FAMSeC: A Few-shot-sample-based General AI-generated Image Detection Method Juncong Xu Yang Yang Han Fang Honggu Liu Weiming Zhang 24 1 0 17 Oct 2024
Unlocking the Capabilities of Masked Generative Models for Image Synthesis via Self-Guidance Jiwan Hur Dong-Jae Lee Gyojin Han Jaehyun Choi Yunho Jeon Junmo Kim DiffM 20 0 0 17 Oct 2024
DreamCraft3D++: Efficient Hierarchical 3D Generation with Multi-Plane Reconstruction Model Jingxiang Sun Cheng Peng Ruizhi Shao Y. Guo Xiaochen Zhao Yangguang Li Yanpei Cao Bo Zhang Yebin Liu 36 2 0 16 Oct 2024
Towards Reliable Verification of Unauthorized Data Usage in Personalized Text-to-Image Diffusion Models Boheng Li Yanhao Wei Yankai Fu Z. Wang Yiming Li Jie Zhang Run Wang Tianwei Zhang DiffM AAML 21 9 0 14 Oct 2024
EBDM: Exemplar-guided Image Translation with Brownian-bridge Diffusion Models Eungbean Lee Somi Jeong K. Sohn DiffM 28 1 0 13 Oct 2024
Distillation of Discrete Diffusion through Dimensional Correlations Satoshi Hayakawa Yuhta Takida Masaaki Imaizumi Hiromi Wakaki Yuki Mitsufuji DiffM 56 0 0 11 Oct 2024
$$\textit{Jump Your Steps}$: Optimizing Sampling Schedule of Discrete Diffusion Models$ $\textit{Jump Your Steps}$ : Optimizing Sampling Schedule of Discrete Diffusion Models Yong-Hyun Park Chieh-Hsin Lai Satoshi Hayakawa Yuhta Takida Yuki Mitsufuji 54 4 0 10 Oct 2024
Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis Jinbin Bai Tian-Chun Ye Wei Chow Enxin Song Qing-Guo Chen Xiangtai Li Zhen Dong Lei Zhu 50 13 0 10 Oct 2024
MotionAura: Generating High-Quality and Motion Consistent Videos using Discrete Diffusion Onkar Susladkar Jishu Sen Gupta Chirag Sehgal Sparsh Mittal Rekha Singhal DiffM VGen 33 0 0 10 Oct 2024
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models Xiaoxiao He Ligong Han Quan Dao Song Wen Minhao Bai ... Hongdong Li Junzhou Huang Faez Ahmed Akash Srivastava Dimitris Metaxas DiffM SyDa 38 4 0 10 Oct 2024
G2D2: Gradient-guided Discrete Diffusion for image inverse problem solving Naoki Murata Chieh-Hsin Lai Yuhta Takida Toshimitsu Uesaka Bac Nguyen Stefano Ermon Yuki Mitsufuji DiffM 51 1 0 09 Oct 2024
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think Sihyun Yu Sangkyung Kwak Huiwon Jang Jongheon Jeong Jonathan Huang Jinwoo Shin Saining Xie OCL 68 62 0 09 Oct 2024
ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-free Way Jiazi Bu Pengyang Ling Pan Zhang Tong Wu Xiaoyi Dong Yuhang Zang Yuhang Cao Dahua Lin Jiaqi Wang DiffM VGen 28 0 0 08 Oct 2024
From Incomplete Coarse-Grained to Complete Fine-Grained: A Two-Stage Framework for Spatiotemporal Data Reconstruction Ziyu Sun Haoyang Su E. Wang Funing Yang Yongjian Yang Wenbin Liu AI4TS DiffM 24 0 0 05 Oct 2024
How Discrete and Continuous Diffusion Meet: Comprehensive Analysis of Discrete Diffusion Models via a Stochastic Integral Framework Yinuo Ren Haoxuan Chen Grant M. Rotskoff Lexing Ying 33 3 0 04 Oct 2024
Data Extrapolation for Text-to-image Generation on Small Datasets Senmao Ye Fei Liu 23 0 0 02 Oct 2024
Learning Multimodal Latent Generative Models with Energy-Based Prior Shiyu Yuan Jiali Cui Hanao Li Tian Han 19 0 0 30 Sep 2024
Text-driven Human Motion Generation with Motion Masked Diffusion Model Xingyu Chen DiffM VGen 26 1 0 29 Sep 2024
Conditional Image Synthesis with Diffusion Models: A Survey Zheyuan Zhan Defang Chen Jian-Ping Mei Zhenghe Zhao Jiawei Chen Chun Chen Siwei Lyu Can Wang VLM 38 4 0 28 Sep 2024
Fusion is all you need: Face Fusion for Customized Identity-Preserving Image Synthesis Salaheldin Mohamed Dong Han Yong Li 13 1 0 27 Sep 2024
Detecting Dataset Abuse in Fine-Tuning Stable Diffusion Models for Text-to-Image Synthesis Songrui Wang Yubo Zhu Wei Tong Sheng Zhong WIGM 22 0 0 27 Sep 2024
Layout-Corrector: Alleviating Layout Sticking Phenomenon in Discrete Diffusion Model Shoma Iwai Atsuki Osanai Shunsuke Kitada S. Omachi 3DV 18 2 0 25 Sep 2024
JVID: Joint Video-Image Diffusion for Visual-Quality and Temporal-Consistency in Video Generation Hadrien Reynaud Matthew Baugh Mischa Dombrowski Sarah Cechnicka Qingjie Meng Bernhard Kainz VLM 31 0 0 21 Sep 2024
RaggeDi: Diffusion-based State Estimation of Disordered Rags, Sheets, Towels and Blankets Jikai Ye Wanze Li Shiraz Khan Gregory S. Chirikjian DiffM 18 0 0 18 Sep 2024
SDP: Spiking Diffusion Policy for Robotic Manipulation with Learnable Channel-Wise Membrane Thresholds Zhixing Hou Maoxu Gao Hang Yu Mengyu Yang Chio-in Ieong 33 1 0 17 Sep 2024