Hierarchical Text-Conditional Image Generation with CLIP Latents

13 April 2022

Papers citing "Hierarchical Text-Conditional Image Generation with CLIP Latents"

50 / 4,735 papers shown

Title
A Survey on Leveraging Pre-trained Generative Adversarial Networks for Image Editing and Restoration Ming-Yu Liu Yuxiang Wei Xiaohe Wu Wangmeng Zuo Lei Zhang 15 1 0 21 Jul 2022
Diffsound: Discrete Diffusion Model for Text-to-sound Generation Dongchao Yang Jianwei Yu Helin Wang Wen Wang Chao Weng Yuexian Zou Dong Yu DiffM 17 288 0 20 Jul 2022
NUWA-Infinity: Autoregressive over Autoregressive Generation for Infinite Visual Synthesis Chenfei Wu Jian Liang Xiaowei Hu Zhe Gan Jianfeng Wang Lijuan Wang Zicheng Liu Yuejian Fang Nan Duan VGen 10 72 0 20 Jul 2022
ShapeCrafter: A Recursive Text-Conditioned 3D Shape Generation Model Rao Fu Xiaoyu Zhan Yiwen Chen Daniel E. Ritchie Srinath Sridhar 19 78 0 19 Jul 2022
Mimetic Models: Ethical Implications of AI that Acts Like You Reid McIlroy-Young Jon M. Kleinberg S. Sen Solon Barocas Ashton Anderson 9 15 0 19 Jul 2022
Progressive Deblurring of Diffusion Models for Coarse-to-Fine Image Synthesis Sangyun Lee Hyungjin Chung Jaehyeon Kim Jong Chul Ye DiffM 15 45 0 16 Jul 2022
How to Reuse and Compose Knowledge for a Lifetime of Tasks: A Survey on Continual Learning and Functional Composition Jorge Armando Mendez Mendez Eric Eaton KELM CLL 11 27 0 15 Jul 2022
WaveGAN: Frequency-aware GAN for High-Fidelity Few-shot Image Generation Mengping Yang Zhe Wang Ziqiu Chi Wenyi Feng 10 46 0 15 Jul 2022
LaT: Latent Translation with Cycle-Consistency for Video-Text Retrieval Jinbin Bai Chunhui Liu Feiyue Ni Haofan Wang Mengying Hu Xiaofeng Guo Lele Cheng 34 11 0 11 Jul 2022
LM-Nav: Robotic Navigation with Large Pre-Trained Models of Language, Vision, and Action Dhruv Shah B. Osinski Brian Ichter Sergey Levine LM&Ro 136 430 0 10 Jul 2022
Improving Diffusion Model Efficiency Through Patching Troy Luhman Eric Luhman DiffM 9 18 0 09 Jul 2022
Accelerating Material Design with the Generative Toolkit for Scientific Discovery Matteo Manica Jannis Born Joris Cadow Dimitrios Christofidellis A. Dave ... Lauren N. McHugh Alexy Khrabrov Payel Das Seiji Takeda John Smith 11 26 0 08 Jul 2022
Big Learning Yulai Cong Miaoyun Zhao AI4CE 11 0 0 08 Jul 2022
Exploring Generative Adversarial Networks for Text-to-Image Generation with Evolution Strategies Victor G. Turrisi da Costa Nuno Lourenço João Correia Penousal Machado GAN 9 1 0 06 Jul 2022
Can Language Understand Depth? Renrui Zhang Ziyao Zeng Ziyu Guo Yafeng Li VLM MDE 11 71 0 03 Jul 2022
American == White in Multimodal Language-and-Image AI Robert Wolfe Aylin Caliskan VLM 19 46 0 01 Jul 2022
Deep Learning and Symbolic Regression for Discovering Parametric Equations Michael Zhang Samuel Kim Peter Y. Lu M. Soljavcić 11 18 0 01 Jul 2022
Distilling Model Failures as Directions in Latent Space Saachi Jain Hannah Lawrence Ankur Moitra A. Madry 9 88 0 29 Jun 2022
Beyond neural scaling laws: beating power law scaling via data pruning Ben Sorscher Robert Geirhos Shashank Shekhar Surya Ganguli Ari S. Morcos 15 413 0 29 Jun 2022
Memory Safe Computations with XLA Compiler A. Artemev Tilman Roeder Mark van der Wilk 8 8 0 28 Jun 2022
Studying Generalization Through Data Averaging C. Gomez-Uribe FedML 11 0 0 28 Jun 2022
Perspective (In)consistency of Paint by Text Hany Farid DiffM 17 36 0 27 Jun 2022
Repository-Level Prompt Generation for Large Language Models of Code Disha Shrivastava Hugo Larochelle Daniel Tarlow 10 135 0 26 Jun 2022
Text-Driven Stylization of Video Objects Sebastian Loeschcke Serge J. Belongie Sagie Benaim VGen DiffM 12 16 0 24 Jun 2022
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos Bowen Baker Ilge Akkaya Peter Zhokhov Joost Huizinga Jie Tang Adrien Ecoffet Brandon Houghton Raul Sampedro Jeff Clune OffRL 15 286 0 23 Jun 2022
The ArtBench Dataset: Benchmarking Generative Models with Artworks Peiyuan Liao Xiuyu Li Xihui Liu Kurt Keutzer 9 47 0 22 Jun 2022
A Study on the Evaluation of Generative Models Eyal Betzalel Coby Penso Aviv Navon Ethan Fetaya EGVM 17 34 0 22 Jun 2022
Scaling Autoregressive Models for Content-Rich Text-to-Image Generation Jiahui Yu Yuanzhong Xu Jing Yu Koh Thang Luong Gunjan Baid ... Zarana Parekh Xin Li Han Zhang Jason Baldridge Yonghui Wu EGVM 48 1,057 0 22 Jun 2022
EpiGRAF: Rethinking training of 3D GANs Ivan Skorokhodov Sergey Tulyakov Yiqun Wang Peter Wonka DiffM 12 125 0 21 Jun 2022
Generative Modelling With Inverse Heat Dissipation Severi Rissanen Markus Heinonen Arno Solin DiffM 11 73 0 21 Jun 2022
StudioGAN: A Taxonomy and Benchmark of GANs for Image Synthesis Minguk Kang Joonghyuk Shin Jaesik Park EGVM 6 66 0 19 Jun 2022
Score-Guided Intermediate Layer Optimization: Fast Langevin Mixing for Inverse Problems Giannis Daras Y. Dagan A. Dimakis C. Daskalakis BDL 13 14 0 18 Jun 2022
Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks Jiasen Lu Christopher Clark Rowan Zellers Roozbeh Mottaghi Aniruddha Kembhavi ObjD VLM MLLM 28 391 0 17 Jun 2022
Lossy Compression with Gaussian Diffusion Lucas Theis Tim Salimans Matthew D. Hoffman Fabian Mentzer DiffM 17 76 0 17 Jun 2022
MineDojo: Building Open-Ended Embodied Agents with Internet-Scale Knowledge Linxi Fan Guanzhi Wang Yunfan Jiang Ajay Mandlekar Yuncong Yang Haoyi Zhu Andrew Tang De-An Huang Yuke Zhu Anima Anandkumar LM&Ro 24 343 0 17 Jun 2022
MixGen: A New Multi-Modal Data Augmentation Xiaoshuai Hao Yi Zhu Srikar Appalaraju Aston Zhang Wanqian Zhang Boyang Li Mu Li VLM 15 80 0 16 Jun 2022
Know your audience: specializing grounded language models with listener subtraction Aaditya K. Singh David Ding Andrew M. Saxe Felix Hill Andrew Kyle Lampinen 12 2 0 16 Jun 2022
Sharper Convergence Guarantees for Asynchronous SGD for Distributed and Federated Learning Anastasia Koloskova Sebastian U. Stich Martin Jaggi FedML 17 76 0 16 Jun 2022
On Privacy and Personalization in Cross-Silo Federated Learning Ziyu Liu Shengyuan Hu Zhiwei Steven Wu Virginia Smith FedML 18 49 0 16 Jun 2022
Write and Paint: Generative Vision-Language Models are Unified Modal Learners Shizhe Diao Wangchunshu Zhou Xinsong Zhang Jiawei Wang MLLM AI4CE 8 15 0 15 Jun 2022
Emergent Abilities of Large Language Models Jason W. Wei Yi Tay Rishi Bommasani Colin Raffel Barret Zoph ... Tatsunori Hashimoto Oriol Vinyals Percy Liang J. Dean W. Fedus ELM ReLM LRM 22 2,309 0 15 Jun 2022
CARD: Classification and Regression Diffusion Models Xizewen Han Huangjie Zheng Mingyuan Zhou DiffM 28 107 0 15 Jun 2022
Towards a Solution to Bongard Problems: A Causal Approach Salahedine Youssef Matej Zečević D. Dhami Kristian Kersting 16 5 0 14 Jun 2022
Efficiently Training Low-Curvature Neural Networks Suraj Srinivas Kyle Matoba Himabindu Lakkaraju F. Fleuret AAML 10 15 0 14 Jun 2022
X-Risk Analysis for AI Research Dan Hendrycks Mantas Mazeika 14 67 0 13 Jun 2022
gDDIM: Generalized denoising diffusion implicit models Qinsheng Zhang Molei Tao Yongxin Chen DiffM 18 111 0 11 Jun 2022
Multi-instrument Music Synthesis with Spectrogram Diffusion Curtis Hawthorne Ian Simon Adam Roberts Neil Zeghidour Josh Gardner Ethan Manilow Jesse Engel DiffM 21 48 0 11 Jun 2022
Is Self-Supervised Learning More Robust Than Supervised Learning? Yuanyi Zhong Haoran Tang Jun-Kun Chen Jian-wei Peng Yu-xiong Wang SSL OOD 14 23 0 10 Jun 2022
Refining neural network predictions using background knowledge Alessandro Daniele Emile van Krieken Luciano Serafini F. V. Harmelen 6 11 0 10 Jun 2022
Spatial Entropy as an Inductive Bias for Vision Transformers E. Peruzzo E. Sangineto Yahui Liu Marco De Nadai Wei Bi Bruno Lepri N. Sebe ViT MDE 15 1 0 09 Jun 2022