Title
Neo: Real-Time On-Device 3D Gaussian Splatting with Reuse-and-Update Sorting Acceleration Changhun Oh Seongryong Oh Jinwoo Hwang Yoonsung Kim Hardik Sharma Jongse Park 3DGS 158 0 0 17 Nov 2025
One-Step Generative Policies with Q-Learning: A Reformulation of MeanFlow Zeyuan Wang Da Li Yulin Chen Ye-ling Shi Liang Bai Tianyuan Yu Yanwei Fu OffRL 136 0 0 17 Nov 2025
Distribution Matching Distillation Meets Reinforcement Learning Dengyang Jiang Dongyang Liu Zanyi Wang Qilong Wu Liuzhuozheng Li ... Bo Zhang Mengmeng Wang Steven Hoi Peng Gao H. Yang 352 0 0 17 Nov 2025
Text2Traffic: A Text-to-Image Generation and Editing Method for Traffic Scenes Feng Lv Haoxuan Feng Zilu Zhang Chunlong Xia Yanfeng Li DiffM 277 0 0 17 Nov 2025
Which Way from B to A: The role of embedding geometry in image interpolation for Stable Diffusion Nicholas Karris Luke Durell Javier Flores Tegan Emerson 124 0 0 16 Nov 2025
DINO-Detect: A Simple yet Effective Framework for Blur-Robust AI-Generated Image Detection Jialiang Shen Jiyang Zheng Yunqi Xue Huajie Chen Yu Yao ... Ruiqi Liu Helin Gong Yang Yang Dadong Wang Tongliang Liu 207 0 0 16 Nov 2025
HiGFA: Hierarchical Guidance for Fine-grained Data Augmentation with Diffusion Models Zhiguang Lu Qianqian Xu Peisong Wen Siran Da Qingming Huang DiffM 605 0 0 16 Nov 2025
TempoMaster: Efficient Long Video Generation via Next-Frame-Rate Prediction Yukuo Ma Cong Liu Junke Wang J. Liu Haibin Huang Zuxuan Wu C. Zhang Xuelong Li VGen 98 0 0 16 Nov 2025
GeoMVD: Geometry-Enhanced Multi-View Generation Model Based on Geometric Information Extraction Jiaqi Wu Yaosen Chen Shuyuan Zhu VGen 280 0 0 15 Nov 2025
Mixture of States: Routing Token-Level Dynamics for Multimodal Generation Haozhe Liu Ding Liu Mingchen Zhuge Zijian Zhou Tian Xie ... Juan-Manuel Perez-Rua Tao Xiang Wei Liu Shikun Liu Jürgen Schmidhuber 84 0 0 15 Nov 2025
Learning Straight Flows: Variational Flow Matching for Efficient Generation Chenrui Ma Xi Xiao Tianyang Wang Xiao Wang Yanning Shen 144 2 0 15 Nov 2025
Explainable AI-Generated Image Detection RewardBench Michael Yang Shijian Deng William T. Doan Kai Wang Tianyu Yang Harsh Singh Yapeng Tian EGVM 178 0 0 15 Nov 2025
One Small Step in Latent, One Giant Leap for Pixels: Fast Latent Upscale Adapter for Your Diffusion Models Aleksandr Razin Danil Kazantsev Ilya Makarov 160 0 0 13 Nov 2025
HardFlow: Hard-Constrained Sampling for Flow-Matching Models via Trajectory Optimization Zeyang Li Kaveh Alim Navid Azizan 308 0 0 11 Nov 2025
Gateways to Tractability for Satisfiability in Pearl's Causal Hierarchy R. Ganian Marlene Gründel Simon Wietheger TPM LRM 213 0 0 11 Nov 2025
Beyond Randomness: Understand the Order of the Noise in Diffusion Song Yan Min Li Bi Xinliang J. Yang Yusen Zhang Guanye Xiong Yunwei Lan Tao Zhang Wei Zhai Zheng-jun Zha DiffM 276 0 0 11 Nov 2025
Simulating the Visual World with Artificial Intelligence: A Roadmap Jingtong Yue Z. Huang Z. Chen Xintao Wang Pengfei Wan Ziwei Liu VGen LM&Ro 360 0 0 11 Nov 2025
SynWeather: Weather Observation Data Synthesis across Multiple Regions and Variables via a General Diffusion Transformer Kaiyi Xu Junchao Gong Zhiwang Zhou Zhangrui Li Yuandong Pu Yihao Liu Ben Fei Fenghua Ling Wenlong Zhang Lei Bei 137 0 0 11 Nov 2025
Rectified Noise: A Generative Model Using Positive-incentive Noise Zhenyu Gu Yanchen Xu Sida Huang Yubin Guo Hongyuan Zhang 205 3 0 11 Nov 2025
Laytrol: Preserving Pretrained Knowledge in Layout Control for Multimodal Diffusion Transformers Sida Huang Siqi Huang Ping Luo Hongyuan Zhang DiffM 244 2 0 11 Nov 2025
Toward the Frontiers of Reliable Diffusion Sampling via Adversarial Sinkhorn Attention Guidance Kwanyoung Kim DiffM 158 0 0 10 Nov 2025
Generating an Image From 1,000 Words: Enhancing Text-to-Image With Structured Captions Eyal Gutflaish Eliran Kachlon Hezi Zisman Tal Hacham Nimrod Sarid ... Saar Huberman Gal Davidi Guy Bukchin Kfir Goldberg Ron Mokady DiffM VLM 213 1 0 10 Nov 2025
VAEVQ: Enhancing Discrete Visual Tokenization through Variational Modeling Sicheng Yang Xing Hu Qiang Wu Dawei Yang 161 0 0 10 Nov 2025
Neodragon: Mobile Video Generation using Diffusion Transformer Animesh Karnewar Denis Korzhenkov Ioannis Lelekas Adil Karjauv Noor Fathima ... Rafael Esteves Tushar Singhal Fatih Porikli Mohsen Ghafoorian A. Habibian DiffM VGen 148 0 0 08 Nov 2025
Latent Refinement via Flow Matching for Training-free Linear Inverse Problem Solving Hossein Askari Yadan Luo Hongfu Sun Fred Roosta 178 0 0 08 Nov 2025
CGCE: Classifier-Guided Concept Erasure in Generative Models Viet Nguyen Vishal M. Patel 148 0 0 08 Nov 2025
MALeR: Improving Compositional Fidelity in Layout-Guided Generation Shivank Saxena D. Srivastava Makarand Tapaswi DiffM 126 0 0 08 Nov 2025
On Flow Matching KL Divergence Maojiang Su Jerry Yao-Chieh Hu Sophia Pi Han Liu 288 0 0 07 Nov 2025
FreeControl: Efficient, Training-Free Structural Control via One-Step Attention Extraction Jiang Lin Xinyu Chen Song Wu Zhiqiu Zhang Jizhi Zhang Ye Wang Qiang Tang Qian Wang Jian Yang Zili Yi DiffM 124 0 0 07 Nov 2025
Perceptually Aligning Representations of Music via Noise-Augmented Autoencoders Mathias Rose Bjare Giorgia Cantisani Marco Pasini Stefan Lattner Gerhard Widmer DiffM 289 0 0 07 Nov 2025
Culture in Action: Evaluating Text-to-Image Models through Social Activities Sina Malakouti Boqing Gong Adriana Kovashka EGVM VLM 342 0 0 07 Nov 2025
InfinityStar: Unified Spacetime AutoRegressive Modeling for Visual Generation Jinlai Liu J. N. Han B. Yan Hui Wu Fengda Zhu Xing-Hui Wang Yi Jiang Bingyue Peng Zehuan Yuan VGen 252 2 0 06 Nov 2025
Tortoise and Hare Guidance: Accelerating Diffusion Model Inference with Multirate Integration Yunghee Lee Byeonghyun Pak Junwha Hong Hoseong Kim 200 0 0 06 Nov 2025
Diffusion-SDPO: Safeguarded Direct Preference Optimization for Diffusion Models Minghao Fu Guo-Hua Wang Tianyu Cui Qing-Guo Chen Zhao Xu Weihua Luo Kaifu Zhang 216 1 0 05 Nov 2025
Dexterous Robotic Piano Playing at Scale Le Chen Yi Zhao Jan Schneider Quankai Gao Simon Guist Cheng Qian Juho Kannala Bernhard Schölkopf Joni Pajarinen Dieter Büchler 144 0 0 04 Nov 2025
UniLumos: Fast and Unified Image and Video Relighting with Physics-Plausible Feedback Ropeway Liu Hangjie Yuan B. Dong Jiazheng Xing Jinwang Wang Rui Zhao Yan Xing Weihua Chen F. Wang VGen 138 0 0 03 Nov 2025
EraseFlow: Learning Concept Erasure Policies via GFlowNet-Driven Alignment Abhiram Kusumba Maitreya Patel Kyle Min Changhoon Kim Chitta Baral Yezhou Yang MU 506 1 0 02 Nov 2025
Phased DMD: Few-step Distribution Matching Distillation via Score Matching within Subintervals Xiangyu Fan Zesong Qiu Z. Wu Fanzhou Wang Zhiqian Lin Tianxiang Ren Dahua Lin Ruihao Gong Lei Yang DiffM 165 1 0 31 Oct 2025
BlurGuard: A Simple Approach for Robustifying Image Protection Against AI-Powered Editing J. Kim Yunhun Nam Minseon Kim Sangpil Kim Jongheon Jeong AAML DiffM 201 0 0 31 Oct 2025
Dual-Stream Diffusion for World-Model Augmented Vision-Language-Action Model John Won Kyungmin Lee Huiwon Jang Dongyoung Kim Jinwoo Shin 157 2 0 31 Oct 2025
Understanding the Implicit User Intention via Reasoning with Large Language Model for Image Editing Yijia Wang Yiqing Shen Weiming Chen Z. He DiffM 128 0 0 31 Oct 2025
OmniX: From Unified Panoramic Generation and Perception to Graphics-Ready 3D Scenes Yukun Huang Jiwen Yu Yanning Zhou Jianan Wang Xintao Wang Pengfei Wan Xihui Liu VGen 129 0 0 30 Oct 2025
MIRO: MultI-Reward cOnditioned pretraining improves T2I quality and efficiency Nicolas Dufour Lucas Degeorge Arijit Ghosh Vicky Kalogeiton David Picard EGVM 340 1 0 29 Oct 2025
ScaleDiff: Higher-Resolution Image Synthesis via Efficient and Model-Agnostic Diffusion Sungho Koh SeungJu Cha Hyunwoo Oh Kwanyoung Lee Dong-Jin Kim 200 0 0 29 Oct 2025
Training-Free Safe Text Embedding Guidance for Text-to-Image Diffusion Models Byeonghu Na Mina Kang Jiseok Kwak Minsang Park Jiwoo Shin SeJoon Jun Gayoung Lee Jin-Hwa Kim Il-Chul Moon 196 0 0 28 Oct 2025
Diffusion Adaptive Text Embedding for Text-to-Image Diffusion Models Byeonghu Na Minsang Park Gyuwon Sim DongHyeok Shin Heesun Bae Mina Kang Se Jung Kwon Wanmo Kang Il-Chul Moon 191 1 0 28 Oct 2025
World Simulation with Video Foundation Models for Physical AI Nvidia A. M. Ali Junjie Bai Maciej Bala Yogesh Balaji ... Jing Zhang Qinsheng Zhang Kaiwen Zheng Andrew Zhu Yuke Zhu VGen PINN 399 15 0 28 Oct 2025
Decoupled MeanFlow: Turning Flow Models into Flow Maps for Accelerated Sampling Kyungmin Lee Sihyun Yu Jinwoo Shin AI4CE 222 3 0 28 Oct 2025
Group Relative Attention Guidance for Image Editing Xuanpu Zhang Xuesong Niu Ruidong Chen Dan Song Jianhao Zeng Penghui Du Haoxiang Cao Kai Wu An-an Liu DiffM 162 0 0 28 Oct 2025
$M$^{3}$T2IBench: A Large-Scale Multi-Category, Multi-Instance, Multi-Relation Text-to-Image Benchmark$ M $^{3}$ T2IBench: A Large-Scale Multi-Category, Multi-Instance, Multi-Relation Text-to-Image Benchmark Huixuan Zhang Xiaojun Wan VLM 238 0 0 27 Oct 2025