ImageBART: Bidirectional Context with Multinomial Diffusion for Autoregressive Image Synthesis

19 August 2021

Papers citing "ImageBART: Bidirectional Context with Multinomial Diffusion for Autoregressive Image Synthesis"

34 / 34 papers shown

Title
Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities X. Zhang Jintao Guo Shanshan Zhao Minghao Fu Lunhao Duan Guo-Hua Wang Qing-Guo Chen Zhao Xu Weihua Luo Kaifu Zhang DiffM 62 0 0 05 May 2025
A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications Siyuan Mu Sen Lin MoE 98 1 0 10 Mar 2025
DICE: Discrete Inversion Enabling Controllable Editing for Multinomial Diffusion and Masked Generative Models Xiaoxiao He Ligong Han Quan Dao Song Wen Minhao Bai ... Hongdong Li Junzhou Huang Faez Ahmed Akash Srivastava Dimitris Metaxas DiffM SyDa 38 4 0 10 Oct 2024
Enhancing User-Centric Privacy Protection: An Interactive Framework through Diffusion Models and Machine Unlearning Huaxi Huang Xin Yuan Qiyu Liao Dadong Wang Tongliang Liu DiffM 20 0 0 05 Sep 2024
Attacks and Defenses for Generative Diffusion Models: A Comprehensive Survey V. T. Truong Luan Ba Dang Long Bao Le DiffM MedIm 38 16 0 06 Aug 2024
UniCode: Learning a Unified Codebook for Multimodal Large Language Models Sipeng Zheng Bohan Zhou Yicheng Feng Ye Wang Zongqing Lu VLM MLLM 26 7 0 14 Mar 2024
AvatarMMC: 3D Head Avatar Generation and Editing with Multi-Modal Conditioning W. Para Abdelrahman Eldesokey Zhenyu Li Pradyumna Reddy Jiankang Deng Peter Wonka DiffM 22 0 0 08 Feb 2024
IPAD: Iterative, Parallel, and Diffusion-based Network for Scene Text Recognition Xiaomeng Yang Zhi Qiao Yu Zhou DiffM 55 1 0 19 Dec 2023
Free3D: Consistent Novel View Synthesis without 3D Representation Chuanxia Zheng Andrea Vedaldi 3DV 37 48 0 07 Dec 2023
Composer Style-specific Symbolic Music Generation Using Vector Quantized Discrete Diffusion Models Jincheng Zhang Jingjing Tang C. Saitis Gyorgy Fazekas DiffM 25 3 0 21 Oct 2023
Improving Compositional Text-to-image Generation with Large Vision-Language Models Song Wen Guian Fang Renrui Zhang Peng Gao Hao Dong Dimitris N. Metaxas 21 17 0 10 Oct 2023
Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using only Images Cuican Yu Guansong Lu Yihan Zeng Jian-jun Sun Xiaodan Liang Huibin Li Zongben Xu Songcen Xu Wei Zhang Hang Xu 33 14 0 31 Aug 2023
Flow Matching in Latent Space Quan Dao Hao Phung Binh Duc Nguyen Anh Tran 31 59 0 17 Jul 2023
ReVersion: Diffusion-Based Relation Inversion from Images Ziqi Huang Tianxing Wu Yuming Jiang Kelvin C. K. Chan Ziwei Liu 20 65 0 23 Mar 2023
Lformer: Text-to-Image Generation with L-shape Block Parallel Decoding Jiacheng Li Longhui Wei Zongyuan Zhan Xinfu He Siliang Tang Qi Tian Yueting Zhuang 16 4 0 07 Mar 2023
A Reparameterized Discrete Diffusion Model for Text Generation Lin Zheng Jianbo Yuan Lei Yu Lingpeng Kong DiffM 23 57 0 11 Feb 2023
Unified Discrete Diffusion for Simultaneous Vision-Language Generation Minghui Hu Chuanxia Zheng Heliang Zheng Tat-Jen Cham Chaoyue Wang Zuopeng Yang Dacheng Tao Ponnuthurai Nagaratnam Suganthan DiffM 18 23 0 27 Nov 2022
A Unified Pyramid Recurrent Network for Video Frame Interpolation Xin Jin Longhai Wu Jie Chen Youxin Chen Jayoon Koo Cheul-hee Hahm 15 35 0 07 Nov 2022
Efficient Diffusion Models for Vision: A Survey Anwaar Ulhaq Naveed Akhtar MedIm 32 59 0 07 Oct 2022
Diffusion Models for Graphs Benefit From Discrete State Spaces K. Haefeli Karolis Martinkus Nathanael Perraudin Roger Wattenhofer DiffM 83 51 0 04 Oct 2022
Frido: Feature Pyramid Diffusion for Complex Scene Image Synthesis Wanshu Fan Yen-Chun Chen Dongdong Chen Yu Cheng Lu Yuan Yu-Chiang Frank Wang DiffM 15 90 0 29 Aug 2022
Blended Latent Diffusion Omri Avrahami Ohad Fried Dani Lischinski DiffM 50 374 0 06 Jun 2022
Text2Human: Text-Driven Controllable Human Image Generation Yuming Jiang Shuai Yang Haonan Qiu Wayne Wu Chen Change Loy Ziwei Liu DiffM 107 45 0 31 May 2022
A Continuous Time Framework for Discrete Denoising Models Andrew Campbell Joe Benton Valentin De Bortoli Tom Rainforth George Deligiannidis Arnaud Doucet DiffM 183 134 0 30 May 2022
Autoregressive Image Generation using Residual Quantization Doyup Lee Chiheon Kim Saehoon Kim Minsu Cho Wook-Shin Han VGen 168 325 0 03 Mar 2022
High-Resolution Image Synthesis with Latent Diffusion Models Robin Rombach A. Blattmann Dominik Lorenz Patrick Esser Bjorn Ommer 3DV 83 14,580 0 20 Dec 2021
Global Context with Discrete Diffusion in Vector Quantised Modelling for Image Generation Minghui Hu Yujie Wang Tat-Jen Cham Jianfei Yang P.N.Suganthan DiffM 11 40 0 03 Dec 2021
Diffusion Autoencoders: Toward a Meaningful and Decodable Representation Konpat Preechakul Nattanat Chatthee Suttisak Wizadwongsa Supasorn Suwajanakorn SyDa DiffM 27 413 0 30 Nov 2021
EdiBERT, a generative model for image editing Thibaut Issenhuth Ugo Tanielian Jérémie Mary David Picard DiffM 13 12 0 30 Nov 2021
Vector Quantized Diffusion Model for Text-to-Image Synthesis Shuyang Gu Dong Chen Jianmin Bao Fang Wen Bo Zhang Dongdong Chen Lu Yuan B. Guo DiffM 45 756 0 29 Nov 2021
VideoGPT: Video Generation using VQ-VAE and Transformers Wilson Yan Yunzhi Zhang Pieter Abbeel A. Srinivas ViT VGen 245 484 0 20 Apr 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 253 4,764 0 24 Feb 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir F. Khan M. Shah ViT 225 2,427 0 04 Jan 2021
A Style-Based Generator Architecture for Generative Adversarial Networks Tero Karras S. Laine Timo Aila 262 10,320 0 12 Dec 2018