v1v2 (latest)

Neural Discrete Representation Learning

2 November 2017

Papers citing "Neural Discrete Representation Learning"

50 / 3,824 papers shown

Smol-GS: Compact Representations for Abstract 3D Gaussian Splatting

189

30 Mar 2026

World Models That Know When They Don't Know - Controllable Video Generation with Calibrated Uncertainty

246

05 Dec 2025

EmoStyle: Emotion-Driven Image Stylization

Jingyuan Yang

Zihuan Bai

Hui Huang

05 Dec 2025

Denoise to Track: Harnessing Video Diffusion Priors for Robust Correspondence

300

04 Dec 2025

Joint 3D Geometry Reconstruction and Motion Generation for 4D Synthesis from a Single Image

306

04 Dec 2025

Controllable Long-term Motion Generation with Extended Joint Targets

137

04 Dec 2025

Autoregressive Image Generation Needs Only a Few Lines of Cached Tokens

152

04 Dec 2025

DeRA: Decoupled Representation Alignment for Video Tokenization

132

04 Dec 2025

COOPER: A Unified Model for Cooperative Perception and Reasoning in Spatial Intelligence

...

232

04 Dec 2025

Efficient Generative Transformer Operators For Million-Point PDEs

Armand K. Koupai

Lise Le Boudec

Patrick Gallinari

112

04 Dec 2025

FloodDiffusion: Tailored Diffusion Forcing for Streaming Motion Generation

157

03 Dec 2025

Enhancing next token prediction based pre-training for jet foundation models

140

03 Dec 2025

LSRS: Latent Scale Rejection Sampling for Visual Autoregressive Modeling

Hong-Kai Zheng

Piji Li

03 Dec 2025

U4D: Uncertainty-Aware 4D World Modeling from LiDAR Sequences

188

02 Dec 2025

Mitigating Intra- and Inter-modal Forgetting in Continual Learning of Unified Multimodal Models

341

02 Dec 2025

AutoBrep: Autoregressive B-Rep Generation with Unified Topology and GeometryACM SIGGRAPH Conference and Exhibition on Computer Graphics and Interactive Techniques in Asia (SIGGRAPH Asia), 2025

Xiang Xu

P. Jayaraman

Joseph George Lambourne

219

02 Dec 2025

Graph VQ-Transformer (GVT): Fast and Accurate Molecular Generation via High-Fidelity Discrete Latents

Haozhuo Zheng

Cheng Wang

Yang Liu

02 Dec 2025

Contrastive Deep Learning for Variant Detection in Wastewater Genomic Sequencing

Adele Chinda

Richmond Azumah

Hemanth Demakethepalli Venkateswara

02 Dec 2025

Real-World Robot Control by Deep Active Inference With a Temporally Hierarchical World ModelIEEE Robotics and Automation Letters (IEEE RA-L), 2025

Kentaro Fujii

Shingo Murata

110

01 Dec 2025

TUNA: Taming Unified Visual Representations for Native Unified Multimodal Models

...

201

01 Dec 2025

Mofasa: A Step Change in Metal-Organic Framework Generation

162

01 Dec 2025

Q2D2: A Geometry-Aware Audio Codec Leveraging Two-Dimensional Quantization

Tal Shuster

Eliya Nachmani

159

01 Dec 2025

Deconstructing Generative Diversity: An Information Bottleneck Analysis of Discrete Latent Generative Models

Yudi Wu

Wenhao Zhao

Dianbo Liu

161

01 Dec 2025

Lotus-2: Advancing Geometric Dense Prediction with Powerful Image Generative Model

242

30 Nov 2025

Neural Discrete Representation Learning for Sparse-View CBCT Reconstruction: From Algorithm Design to Prospective Multicenter Clinical Evaluation

...

30 Nov 2025

REVEAL: Reasoning-enhanced Forensic Evidence Analysis for Explainable AI-generated Image Detection

...

192

28 Nov 2025

VQRAE: Representation Quantization Autoencoders for Multimodal Understanding, Generation and Reconstruction

...

283

28 Nov 2025

Visual Generation Tuning

352

28 Nov 2025

Quantized-Tinyllava: a new multimodal foundation model enables efficient split learning

J. Guo

Xin Luo

Jie Liu

Yiqun Wang

Kai-Wei Chang

Wei Wang

Jie Liu

140

28 Nov 2025

ReactionMamba: Generating Short & Long Human Reaction Sequences

218

28 Nov 2025

PURE Codec: Progressive Unfolding of Residual Entropy for Speech Codec Learning

181

27 Nov 2025

BrepGPT: Autoregressive B-rep Generation with Voronoi Half-PatchACM Transactions on Graphics (TOG), 2025

127

27 Nov 2025

RAVQ-HoloNet: Rate-Adaptive Vector-Quantized Hologram Compression

Shima Rafiei

Zahra Nabizadeh Shahr Babak

S. Samavi

S. Shirani

171

26 Nov 2025

DiverseVAR: Balancing Diversity and Quality of Next-Scale Visual Autoregressive Models

173

26 Nov 2025

Progress by Pieces: Test-Time Scaling for Autoregressive Image Generation

231

26 Nov 2025

Harmonic-Percussive Disentangled Neural Audio Codec for Bandwidth Extension

223

26 Nov 2025

DINO-Tok: Adapting DINO for Visual Tokenizers

...

Xiao-Xiao Long

Qian Zhang

Ping Tan

Wei Yin

229

25 Nov 2025

SSA: Sparse Sparse Attention by Aligning Full and Sparse Attention Outputs in Feature Space

388

25 Nov 2025

Operationalizing Quantized Disentanglement

100

25 Nov 2025

AI/ML based Joint Source and Channel Coding for HARQ-ACK Payload

25 Nov 2025

PRADA: Probability-Ratio-Based Attribution and Detection of Autoregressive-Generated Images

302

25 Nov 2025

Text-guided Controllable Diffusion for Realistic Camouflage Images Generation

233

25 Nov 2025

Temporal-Visual Semantic Alignment: A Unified Architecture for Transferring Spatial Priors from Vision Models to Zero-Shot Temporal Tasks

340

25 Nov 2025

SKEL-CF: Coarse-to-Fine Biomechanical Skeleton and Surface Mesh Recovery

549

25 Nov 2025

FVAR: Visual Autoregressive Modeling via Next Focus Prediction

208

24 Nov 2025

Robust Long-term Test-Time Adaptation for 3D Human Pose Estimation through Motion Discretization

406

24 Nov 2025

fMRI-LM: Towards a Universal Foundation Model for Language-Aligned fMRI Understanding

222

24 Nov 2025

Multiscale Vector-Quantized Variational Autoencoder for Endoscopic Image SynthesisInternational Symposium on Telecommunications (IST), 2025

Dimitrios E. Diamantis

D. Iakovidis

MedIm

430

24 Nov 2025

Learning Massively Multitask World Models for Continuous Control

581

24 Nov 2025

TRIDENT: A Trimodal Cascade Generative Framework for Drug and RNA-Conditioned Cellular Morphology Synthesis

111

23 Nov 2025