v1v2v3v4 (latest)

ImagenHub: Standardizing the evaluation of conditional image generation models

International Conference on Learning Representations (ICLR), 2023

2 October 2023

ArXiv (abs)PDF HTML HuggingFace (19 upvotes)Github (33279★)

Papers citing "ImagenHub: Standardizing the evaluation of conditional image generation models"

49 / 49 papers shown

BeyondFacial: Identity-Preserving Personalized Generation Beyond Facial Close-ups

339

15 Nov 2025

The Intricate Dance of Prompt Complexity, Quality, Diversity, and Consistency in T2I Models

Xiaofeng Zhang

Aaron Courville

M. Drozdzal

Adriana Romero Soriano

DiffM

210

22 Oct 2025

Small is Sufficient: Reducing the World AI Energy Consumption Through Model Selection

Tiago da Silva Barros

Frédéric Giroire

Ramon Aparicio-Pardo

Joanna Moulierac

219

02 Oct 2025

EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing

181

30 Sep 2025

EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling

287

28 Sep 2025

Human Preference-Aligned Concept Customization Benchmark via Decomposed Evaluation

234

03 Sep 2025

The Promise of RL for Autoregressive Image Editing

Saba Ahmadi

Rabiul Awal

Ankur Sikarwar

Amirhossein Kazemnejad

...

365

01 Aug 2025

ADIEE: Automatic Dataset Creation and Scorer for Instruction-Guided Image Editing Evaluation

331

09 Jul 2025

Multi-Modal Language Models as Text-to-Image Model Evaluators

Jiahui Chen

Candace Ross

Reyhane Askari Hemmat

Koustuv Sinha

Melissa Hall

M. Drozdzal

Adriana Romero-Soriano

EGVM

485

01 May 2025

REED-VAE: RE-Encode Decode Training for Iterative Image Editing with Diffusion Models

307

26 Apr 2025

RefVNLI: Towards Scalable Evaluation of Subject-driven Text-to-image Generation

511

24 Apr 2025

Early Timestep Zero-Shot Candidate Selection for Instruction-Guided Image Editing

378

18 Apr 2025

$$\texttt{Complex-Edit}$: CoT-Like Instruction Generation for Complexity-Controllable Image Editing Benchmark$

\texttt{Complex-Edit}

: CoT-Like Instruction Generation for Complexity-Controllable Image Editing Benchmark

460

17 Apr 2025

A Unified Agentic Framework for Evaluating Conditional Image GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2025

410

09 Apr 2025

MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models

515

04 Apr 2025

3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models

742

27 Mar 2025

Single Image Iterative Subject-driven Generation and Editing

Yair Shpitzer

Gal Chechik

Idan Schwartz

349

20 Mar 2025

Visual Persona: Foundation Model for Full-Body Human CustomizationComputer Vision and Pattern Recognition (CVPR), 2025

390

19 Mar 2025

GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing

...

454

13 Mar 2025

VLForgery Face Triad: Detection, Localization and Attribution via Multimodal Large Language Models

369

08 Mar 2025

IDEA-Bench: How Far are Generative Models from Professional Designing?Computer Vision and Pattern Recognition (CVPR), 2024

407

16 Dec 2024

Towards Unified Benchmark and Models for Multi-Modal Perceptual Metrics

Sara Ghazanfari

Siddharth Garg

Nicolas Flammarion

Prashanth Krishnamurthy

Farshad Khorrami

Francesco Croce

VLM

423

13 Dec 2024

T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive ConceptsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

...

1.2K

05 Dec 2024

OmniEdit: Building Image Editing Generalist Models Through Specialist SupervisionInternational Conference on Learning Representations (ICLR), 2024

611

107

11 Nov 2024

KITTEN: A Knowledge-Intensive Evaluation of Image Generation on Visual Entities

...

425

15 Oct 2024

PixLens: A Novel Framework for Disentangled Evaluation in Diffusion-Based Image Editing with Object Detection + SAM

Stefan Stefanache

Lluís Pastor Pérez

Julen Costa Watanabe

Ernesto Sanchez Tejedor

Thomas Hofmann

Enis Simsar

EGVM

143

08 Oct 2024

Finding the Subjective Truth: Collecting 2 Million Votes for Comprehensive Gen-AI Model Evaluation

Dimitrios Christodoulou

Mads Kuhlmann-Jørgensen

EGVM

234

18 Sep 2024

ABHINAW: A method for Automatic Evaluation of Typography within AI-Generated Images

312

18 Sep 2024

DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation

Yuang Peng

528

110

24 Jun 2024

Holistic Evaluation for Interleaved Text-and-Image Generation

Lifu Huang

352

20 Jun 2024

ExVideo: Extending Video Diffusion Models via Parameter-Efficient Post-Tuning

242

20 Jun 2024

Consistency-diversity-realism Pareto fronts of conditional image generative models

Adriana Romero Soriano

M. Drozdzal

358

14 Jun 2024

Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense?

William Yang Wang

250

11 Jun 2024

GenAI Arena: An Open Evaluation Platform for Generative ModelsNeural Information Processing Systems (NeurIPS), 2024

Wenhu Chen

596

06 Jun 2024

Conditional Idempotent Generative Networks

Niccolò Ronchetti

202

05 Jun 2024

Who Evaluates the Evaluations? Objectively Scoring Text-to-Image Prompt Coherence Metrics with T2IScoreScore (TS2)

Michael Stephen Saxon

402

05 Apr 2024

Evaluating Text-to-Visual Generation with Image-to-Text Generation

Graham Neubig

565

406

01 Apr 2024

AnyV2V: A Tuning-Free Framework For Any Video-to-Video Editing Tasks

653

103

21 Mar 2024

A Survey on Quality Metrics for Text-to-Image GenerationIEEE Transactions on Visualization and Computer Graphics (TVCG), 2024

Timo Ropinski

404

18 Mar 2024

LightIt: Illumination Modeling and Control for Diffusion Models

Peter Kocsis

Julien Philip

Kalyan Sunkavalli

Matthias Nießner

Yannick Hold-Geoffroy

362

15 Mar 2024

Multi-LoRA Composition for Image Generation

297

26 Feb 2024

LSTP: Language-guided Spatial-Temporal Prompt Learning for Long-form Video-Text Understanding

Yuxuan Wang

Yueqian Wang

Pengfei Wu

Jianxin Liang

Dongyan Zhao

Zilong Zheng

VLM

301

25 Feb 2024

Instruct-Imagen: Image Generation with Multi-modal InstructionComputer Vision and Pattern Recognition (CVPR), 2024

...

317

03 Jan 2024

Semantic Guidance Tuning for Text-To-Image Diffusion Models

309

26 Dec 2023

VIEScore: Towards Explainable Metrics for Conditional Image Synthesis Evaluation

433

148

22 Dec 2023

VBench: Comprehensive Benchmark Suite for Video Generative ModelsComputer Vision and Pattern Recognition (CVPR), 2023

...

Dahua Lin

Yu Qiao

Ziwei Liu

VGen

625

1,280

29 Nov 2023

Shadows Don't Lie and Lines Can't Bend! Generative Models don't know Projective Geometry...for nowComputer Vision and Pattern Recognition (CVPR), 2023

D. A. Forsyth

Anand Bhattad

GAN

314

28 Nov 2023

GPT-4V(ision) as a Generalist Evaluator for Vision-Language Tasks

Heng Wang

274

131

02 Nov 2023

Photoswap: Personalized Subject Swapping in ImagesNeural Information Processing Systems (NeurIPS), 2023

Wei Xiong

...

Zhifei Zhang

324

29 May 2023