94

Imagen 3

13 August 2024

Imagen-Team-Google

:

Jason Baldridge

Nicole Brichtova

Kelvin Chan

Yichang Chen

Sander Dieleman

Zach Eaton-Rosen

Nando de Freitas

Evgeny Gladchenko

Sergio Gomez Colmenarejo

Tobenna Peter Igwe

Christos Kaplanis

Siavash Khodadadeh

Ksenia Konyushkova

Soňa Mokrá

Aaron van den Oord

Jordi Pont-Tuset

Rui Qian

Deepak Ramachandran

Abdullah Rashwan

Ali Razavi

Hansa Srinivasan

Srivatsan Srinivasan

Su Wang

Hao Xiong

Keyang Xu

Isabela Albuquerque

Marco Andreetto

Christina Butterfield

Viral Carpenter

Norman Casagrande

Shamik Chaudhuri

Dmitry Churbanau

Mikhail Dektiarev

Shlomi Fruchter

Frankie Garcia

Yena Han

Jamie Hayes

Ed Hirst

Mohamed K. Ibrahim

Dirichi Ike-Njoku

William S. Isaac

Xuhui Jia

Christos Kaplanis

Burcu Karagol Ayan

Suraj Kothawade

Christina Kouridi

Jolanda Kumakaw

Maggie Li-Calis

Javier Lopez Alberca

Yukun Ma

John F. J. Mellor

Tom Murray

Aida Nematzadeh

Joao Gabriel Oliveira

Guillermo Ortiz-Jimenez

Michela Paganini

Tom Le Paine

Alex Pirozhenko

Cyrus Rashtchian

Ali Razavi

Sylvestre-Alvise Rebuffi

Florian Schroff

Candice Schumann

Brendan Shillingford

Kaushik Shivakumar

Dennis Shtatnov

Evgeny Sluzhaev

Valerii Sokolov

Thibault Sottiaux

Florian Stimberg

Shuai Tang

Gregory Thornton

Cristian Udrescu

Aayush Upadhyay

C. N. Vasconcelos

Qifei Wang

Yuxiao Wang

Xingyu Federico Xu

Han Zhang

Jiageng Zhang

Adilet Zhaxybay

Shengqi Zhu

Zhenkai Zhu

Anca Dragan

Koray Kavukcuoglu

Yeqing Li

Kathy Meier-Hellstern

Amar Subramanya

ArXiv (abs)PDF HTML HuggingFace (62 upvotes)

Main:28 Pages

20 Figures

Bibliography:3 Pages

5 Tables

Appendix:4 Pages

Abstract

We introduce Imagen 3, a latent diffusion model that generates high quality images from text prompts. We describe our quality and responsibility evaluations. Imagen 3 is preferred over other state-of-the-art (SOTA) models at the time of evaluation. In addition, we discuss issues around safety and representation, as well as methods we used to minimize the potential harm of our models.

Comments on this paper