Improved Techniques for Training GANs

10 June 2016

Papers citing "Improved Techniques for Training GANs"

50 / 4,341 papers shown

Democratizing Text-to-Image Masked Generative Models with Compact Text-Aware One-Dimensional Tokens

433

13 Jan 2025

Focus-N-Fix: Region-Aware Fine-Tuning for Text-to-Image GenerationComputer Vision and Pattern Recognition (CVPR), 2025

...

306

11 Jan 2025

MEt3R: Measuring Multi-View Consistency in Generated ImagesComputer Vision and Pattern Recognition (CVPR), 2025

256

10 Jan 2025

Magic-Boost: Boost 3D Generation with Multi-View Conditioned Diffusion

403

10 Jan 2025

CAT: Content-Adaptive Image Tokenization

189

06 Jan 2025

Cached Adaptive Token Merging: Dynamic Token Reduction and Redundant Computation Elimination in Diffusion Model

326

03 Jan 2025

MalCL: Leveraging GAN-Based Generative Replay to Combat Catastrophic Forgetting in Malware ClassificationAAAI Conference on Artificial Intelligence (AAAI), 2025

Jimin Park

AHyun Ji

Minji Park

Mohammad Saidur Rahman

Se Eun Oh

223

03 Jan 2025

PQD: Post-training Quantization for Efficient Diffusion Models

Jiaojiao Ye

Zhen Wang

Linnan Jiang

258

03 Jan 2025

Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image ModelsPatterns (Patterns), 2024

447

03 Jan 2025

LoVA: Long-form Video-to-Audio GenerationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2024

258

31 Dec 2024

Grid Diffusion Models for Text-to-Video GenerationComputer Vision and Pattern Recognition (CVPR), 2024

Taegyeong Lee

Soyeong Kwon

Taehwan Kim

313

31 Dec 2024

AdaDiff: Adaptive Step Selection for Fast Diffusion Models

329

31 Dec 2024

TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization

Bryan Catanzaro

Soujanya Poria

375

30 Dec 2024

D-Judge: How Far Are We? Assessing the Discrepancies Between AI-synthesized and Natural Images through Multimodal Guidance

451

23 Dec 2024

TCAQ-DM: Timestep-Channel Adaptive Quantization for Diffusion ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

288

21 Dec 2024

GCA-3D: Towards Generalized and Consistent Domain Adaptation of 3D Generators

...

279

20 Dec 2024

Next Patch Prediction for Autoregressive Visual Generation

...

629

19 Dec 2024

MMAudio: Taming Multimodal Joint Training for High-Quality Video-to-Audio SynthesisComputer Vision and Pattern Recognition (CVPR), 2024

537

19 Dec 2024

E-CAR: Efficient Continuous Autoregressive Image Generation via Multistage Modeling

379

18 Dec 2024

VideoDPO: Omni-Preference Alignment for Video Diffusion GenerationComputer Vision and Pattern Recognition (CVPR), 2024

324

18 Dec 2024

Is Your World Simulator a Good Story Presenter? A Consecutive Events-Based Benchmark for Future Long Video GenerationComputer Vision and Pattern Recognition (CVPR), 2024

331

17 Dec 2024

Attentive Eraser: Unleashing Diffusion Model's Object Removal Potential via Self-Attention Redirection GuidanceAAAI Conference on Artificial Intelligence (AAAI), 2024

789

17 Dec 2024

MPQ-DM: Mixed Precision Quantization for Extremely Low Bit Diffusion ModelsAAAI Conference on Artificial Intelligence (AAAI), 2024

277

16 Dec 2024

Scaled Conjugate Gradient Method for Nonconvex Optimization in Deep Neural Networks

241

16 Dec 2024

SoftVQ-VAE: Efficient 1-Dimensional Continuous TokenizerComputer Vision and Pattern Recognition (CVPR), 2024

664

14 Dec 2024

A Decade of Deep Learning: A Survey on The Magnificent Seven

Dilshod Azizov

Muhammad Arslan Manzoor

...

300

13 Dec 2024

FreeScale: Unleashing the Resolution of Diffusion Models via Tuning-Free Scale Fusion

356

12 Dec 2024

Unlocking Visual Secrets: Inverting Features with Diffusion Priors for Image Reconstruction

310

11 Dec 2024

Intelligent Electric Power Steering: Artificial Intelligence Integration Enhances Vehicle Safety and Performance

Vikas Vyas

Sneha Sudhir Shetiya

LLMSV

166

11 Dec 2024

CAP: Evaluation of Persuasive and Creative Image Generation

Aysan Aghazadeh

Adriana Kovashka

EGVM

397

10 Dec 2024

Sound2Vision: Generating Diverse Visuals from Audio through Cross-Modal Latent Alignment

404

09 Dec 2024

T2I-FactualBench: Benchmarking the Factuality of Text-to-Image Models with Knowledge-Intensive ConceptsAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

...

1.1K

05 Dec 2024

DiffuPT: Class Imbalance Mitigation for Glaucoma Detection via Diffusion Based Generation and Model PretrainingIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

289

04 Dec 2024

BOTracle: A framework for Discriminating Bots and Humans

183

03 Dec 2024

AccDiffusion v2: Towards More Accurate Higher-Resolution Diffusion ExtrapolationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024

317

03 Dec 2024

IQA-Adapter: Exploring Knowledge Transfer from Image Quality Assessment to Diffusion-based Generative Models

480

02 Dec 2024

RandAR: Decoder-only Autoregressive Visual Generation in Random OrdersComputer Vision and Pattern Recognition (CVPR), 2024

392

02 Dec 2024

BiPO: Bidirectional Partial Occlusion Network for Text-to-Motion Synthesis

612

28 Nov 2024

AIGV-Assessor: Benchmarking and Evaluating the Perceptual Quality of Text-to-Video Generation with LMMComputer Vision and Pattern Recognition (CVPR), 2024

257

26 Nov 2024

LiteVAR: Compressing Visual Autoregressive Modelling with Efficient Attention and Quantization

192

26 Nov 2024

Omegance: A Single Parameter for Various Granularities in Diffusion-Based Synthesis

382

26 Nov 2024

Factorized Visual Tokenization and Generation

274

25 Nov 2024

Synthesising Handwritten Music with GANs: A Comprehensive Evaluation of CycleWGAN, ProGAN, and DCGANBigData Congress [Services Society] (BSS), 2024

Elona Shatri

Kalikidhar Palavala

George Fazekas

281

25 Nov 2024

Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric

...

533

25 Nov 2024

ExAL: An Exploration Enhanced Adversarial Learning Algorithm

A Vinil

Aneesh Sreevallabh Chivukula

Pranav Chintareddy

AAML

132

24 Nov 2024

Comparative Analysis of Diffusion Generative Models in Computational Pathology

Denisha Thakkar

Vincent Quoc-Huy Trinh

Sonal Varma

Samira Ebrahimi Kahou

Hassan Rivaz

Mahdi S. Hosseini

MedIm

285

24 Nov 2024

PanoLlama: Generating Endless and Coherent Panoramas with Next-Token-Prediction LLMs

616

24 Nov 2024

Hierarchical Cross-Attention Network for Virtual Try-OnIEEE transactions on multimedia (IEEE TMM), 2024

301

23 Nov 2024

Automatic Evaluation for Text-to-image Generation: Task-decomposed Framework, Distilled Training, and Meta-evaluation BenchmarkAnnual Meeting of the Association for Computational Linguistics (ACL), 2024

361

23 Nov 2024

GLDesigner: Leveraging Multi-Modal LLMs as Designer for Enhanced Aesthetic Text Glyph Layouts

323

18 Nov 2024