Cross-Modal Contrastive Learning for Text-to-Image Generation

12 January 2021

Papers citing "Cross-Modal Contrastive Learning for Text-to-Image Generation"

24 / 74 papers shown

Title
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder Jie Shi Chenfei Wu Jian Liang Xiang Liu Nan Duan DiffM 9 25 0 01 Jun 2022
VALHALLA: Visual Hallucination for Machine Translation Yi Li Rameswar Panda Yoon Kim Chun-Fu Chen Rogerio Feris David D. Cox Nuno Vasconcelos MLLM 36 38 0 31 May 2022
UMSNet: An Universal Multi-sensor Network for Human Activity Recognition Jialiang Wang Hao Wei Yi Wang Shujia Yang Chi Li HAI 20 1 0 24 May 2022
Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding Chitwan Saharia William Chan Saurabh Saxena Lala Li Jay Whang ... Raphael Gontijo-Lopes Tim Salimans Jonathan Ho David J Fleet Mohammad Norouzi VLM 55 5,768 0 23 May 2022
CogView2: Faster and Better Text-to-Image Generation via Hierarchical Transformers Ming Ding Wendi Zheng Wenyi Hong Jie Tang VLM 18 321 0 28 Apr 2022
Hierarchical Text-Conditional Image Generation with CLIP Latents Aditya A. Ramesh Prafulla Dhariwal Alex Nichol Casey Chu Mark Chen VLM DiffM 67 6,622 0 13 Apr 2022
DT2I: Dense Text-to-Image Generation from Region Descriptions Stanislav Frolov Prateek Bansal Jörn Hees Andreas Dengel VLM 19 5 0 05 Apr 2022
StyleT2I: Toward Compositional and High-Fidelity Text-to-Image Synthesis Zhiheng Li Martin Renqiang Min K. Li Chenliang Xu EGVM 25 39 0 29 Mar 2022
Make-A-Scene: Scene-Based Text-to-Image Generation with Human Priors Oran Gafni Adam Polyak Oron Ashual Shelly Sheynin Devi Parikh Yaniv Taigman DiffM 17 510 0 24 Mar 2022
Modulated Contrast for Versatile Image Synthesis Fangneng Zhan Jiahui Zhang Yingchen Yu Rongliang Wu Shijian Lu 22 43 0 17 Mar 2022
DU-VLG: Unifying Vision-and-Language Generation via Dual Sequence-to-Sequence Pre-training Luyang Huang Guocheng Niu Jiachen Liu Xinyan Xiao Hua-Hong Wu VLM CoGe 14 7 0 17 Mar 2022
Diffusion Probabilistic Modeling for Video Generation Ruihan Yang Prakhar Srivastava Stephan Mandt DiffM VGen 32 255 0 16 Mar 2022
CLIP-GEN: Language-Free Training of a Text-to-Image Generator with CLIP Zihao W. Wang Wei Liu Qian He Xin-ru Wu Zili Yi CLIP VLM 182 73 0 01 Mar 2022
CM3: A Causal Masked Multimodal Model of the Internet Armen Aghajanyan Po-Yao (Bernie) Huang Candace Ross Vladimir Karpukhin Hu Xu ... Dmytro Okhonko Mandar Joshi Gargi Ghosh M. Lewis Luke Zettlemoyer 15 154 0 19 Jan 2022
C2-CRS: Coarse-to-Fine Contrastive Learning for Conversational Recommender System Yuanhang Zhou Kun Zhou Wayne Xin Zhao Cheng Wang Peng Jiang He Hu 25 52 0 04 Jan 2022
ERNIE-ViLG: Unified Generative Pre-training for Bidirectional Vision-Language Generation Han Zhang Weichong Yin Yewei Fang Lanxin Li Boqiang Duan Zhihua Wu Yu Sun Hao Tian Hua-Hong Wu Haifeng Wang 27 58 0 31 Dec 2021
GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models Alex Nichol Prafulla Dhariwal Aditya A. Ramesh Pranav Shyam Pamela Mishkin Bob McGrew Ilya Sutskever Mark Chen 64 3,459 0 20 Dec 2021
Vector Quantized Diffusion Model for Text-to-Image Synthesis Shuyang Gu Dong Chen Jianmin Bao Fang Wen Bo Zhang Dongdong Chen Lu Yuan B. Guo DiffM 45 757 0 29 Nov 2021
LAFITE: Towards Language-Free Training for Text-to-Image Generation Yufan Zhou Ruiyi Zhang Changyou Chen Chunyuan Li Chris Tensmeyer Tong Yu Jiuxiang Gu Jinhui Xu Tong Sun VLM 21 162 0 27 Nov 2021
NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion Chenfei Wu Jian Liang Lei Ji Fan Yang Yuejian Fang Daxin Jiang Nan Duan ViT VGen 16 292 0 24 Nov 2021
Creating User Interface Mock-ups from High-Level Text Descriptions with Deep-Learning Models Forrest Huang Gang Li Xin Zhou John F. Canny Yang Li DiffM 27 19 0 14 Oct 2021
Contrastive Attraction and Contrastive Repulsion for Representation Learning Huangjie Zheng Xu Chen Jiangchao Yao Hongxia Yang Chunyuan Li Ya-Qin Zhang Hao Zhang Ivor Tsang Jingren Zhou Mingyuan Zhou SSL 34 12 0 08 May 2021
Adversarial Text-to-Image Synthesis: A Review Stanislav Frolov Tobias Hinz Federico Raue Jörn Hees Andreas Dengel EGVM 14 176 0 25 Jan 2021
Improved Baselines with Momentum Contrastive Learning Xinlei Chen Haoqi Fan Ross B. Girshick Kaiming He SSL 238 3,367 0 09 Mar 2020