v1v2 (latest)

Autoencoding beyond pixels using a learned similarity metric

31 December 2015

Anders Boesen Lindbo Larsen

Papers citing "Autoencoding beyond pixels using a learned similarity metric"

50 / 932 papers shown

Denoise to Track: Harnessing Video Diffusion Priors for Robust Correspondence

257

04 Dec 2025

MRI Super-Resolution with Deep Learning: A Comprehensive Survey

...

393

20 Nov 2025

Decoupling Complexity from Scale in Latent Diffusion Model

320

20 Nov 2025

Generative AI in Depth: A Survey of Recent Advances, Model Variants, and Real-World ApplicationsJournal of Big Data (JBD), 2025

Shamim Yazdani

Akansha Singh

N. Saxena

Sribala Vidyadhari Chinta

203

23 Oct 2025

Quantum Autoencoders for Anomaly Detection in Cybersecurity

Rohan Senthil

Swee Liang Wong

102

22 Oct 2025

Lightweight CycleGAN Models for Cross-Modality Image Transformation and Experimental Quality Assessment in Fluorescence Microscopy

Mohammad Soltaninezhad

17 Oct 2025

UALM: Unified Audio Language Model for Understanding, Generation and Reasoning

...

290

13 Oct 2025

O_O-VC: Synthetic Data-Driven One-to-One Alignment for Any-to-Any Voice Conversion

10 Oct 2025

MelTok: 2D Tokenization for Single-Codebook Audio Compression

312

02 Oct 2025

Cycle Diffusion Model for Counterfactual Image Generation

213

29 Sep 2025

From Autoencoders to CycleGAN: Robust Unpaired Face Manipulation via Adversarial Learning

Collin Guo

Yi Qian

CVBM GAN

289

15 Sep 2025

Equivariant Flow Matching for Symmetry-Breaking Bifurcation Problems

168

03 Sep 2025

Vocoder-Projected Feature Discriminator

150

25 Aug 2025

KB-DMGen: Knowledge-Based Global Guidance and Dynamic Pose Masking for Human Image Generation

249

26 Jul 2025

DOOMGAN:High-Fidelity Dynamic Identity Obfuscation Ocular Generative Morphing

Bharath Krishnamurthy

Ajita Rattani

136

23 Jul 2025

Variational Learning of Disentangled Representations

264

20 Jun 2025

DGAE: Diffusion-Guided Autoencoder for Efficient Latent Representation Learning

293

11 Jun 2025

VIVAT: Virtuous Improving VAE Training through Artifact Mitigation

215

09 Jun 2025

Beyond the Norm: A Survey of Synthetic Data Generation for Rare Events

200

04 Jun 2025

PseudoVC: Improving One-shot Voice Conversion with Pseudo Paired Data

164

01 Jun 2025

When Humans Growl and Birds Speak: High-Fidelity Voice Conversion from Human to Animal and Designed Sounds

129

30 May 2025

SAEs Are Good for Steering -- If You Select the Right Features

425

26 May 2025

Source Separation by Flow Matching

476

22 May 2025

NSW-EPNews: A News-Augmented Benchmark for Electricity Price Forecasting with LLMs

153

22 May 2025

Towards Generating Realistic Underwater Images

Abdul-Kazeem Shamba

GAN

214

20 May 2025

VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption

308

17 May 2025

Generative AI for Urban Planning: Synthesizing Satellite Imagery via Diffusion ModelsComputers, Environment and Urban Systems (CEUS), 2025

216

13 May 2025

Modular Machine Learning: An Indispensable Path towards New-Generation Large Language Models

410

28 Apr 2025

Generative Adversarial Network based Voice Conversion: Techniques, Challenges, and Recent Advancements

Sandipan Dhar

N. D. Jana

Swagatam Das

274

27 Apr 2025

Likelihood-Free Variational Autoencoders

538

24 Apr 2025

Hyper-Transforming Latent Diffusion Models

455

23 Apr 2025

Learning and Generating Diverse Residential Load Patterns Using GAN with Weakly-Supervised Training and Weight SelectionIEEE transactions on consumer electronics (IEEE TCE), 2025

Xinyu Liang

Hao Wang

945

19 Apr 2025

DiffusedWrinkles: A Diffusion-Based Model for Data-Driven Garment AnimationBritish Machine Vision Conference (BMVC), 2025

283

24 Mar 2025

Jasmine: Harnessing Diffusion Prior for Self-supervised Depth Estimation

466

20 Mar 2025

QINCODEC: Neural Audio Compression with Implicit Neural Codebooks

348

19 Mar 2025

A Deep Bayesian Nonparametric Framework for Robust Mutual Information Estimation

245

13 Mar 2025

Memory-Efficient 3D High-Resolution Medical Image Synthesis Using CRF-Guided GANsInternational Conference on Pattern Recognition (ICPR), 2025

161

13 Mar 2025

Steered Generation via Gradient Descent on Sparse Features

Sumanta Bhattacharyya

Pedram Rooshenas

LLMSV

305

25 Feb 2025

High-Fidelity Music Vocoder using Neural Audio CodecsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

306

18 Feb 2025

Generative Adversarial Networks for High-Dimensional Item Factor Analysis: A Deep Adversarial Learning Algorithm

Nanyu Luo

Feng Ji

DRL

484

15 Feb 2025

FlashSR: One-step Versatile Audio Super-resolution via Diffusion DistillationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2025

Jaekwon Im

Juhan Nam

DiffM

342

18 Jan 2025

An Empirical Study of Autoregressive Pre-training from Videos

Jathushan Rajasegaran

Ilija Radosavovic

Rahul Ravishankar

Yossi Gandelsman

Christoph Feichtenhofer

Jitendra Malik

183

10 Jan 2025

Diffusion Model-Based Data Synthesis Aided Federated Semi-Supervised LearningIEEE Wireless Communications and Networking Conference (WCNC), 2025

245

04 Jan 2025

SoftVQ-VAE: Efficient 1-Dimensional Continuous TokenizerComputer Vision and Pattern Recognition (CVPR), 2024

723

14 Dec 2024

Hierarchical Conditional Tabular GAN for Multi-Tabular Synthetic Data Generation

Wilhelm Ågren

Victorio Úbeda Sosa

257

11 Nov 2024

Towards Visual Text Design Transfer Across LanguagesNeural Information Processing Systems (NeurIPS), 2024

Giyeong Oh

164

24 Oct 2024

Longitudinal Causal Image Synthesis

244

23 Oct 2024

Efficient Distribution Matching of Representations via Noise-Injected Deep InfoMax

430

09 Oct 2024

IceCloudNet: 3D reconstruction of cloud ice from Meteosat SEVIRIArtificial Intelligence for the Earth Systems (AI4ES), 2024

127

05 Oct 2024

Khattat: Enhancing Readability and Concept Representation of Semantic Typography

213

01 Oct 2024