v1v2 (latest)

Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding

22 May 2025

ArXiv (abs)PDF HTML HuggingFace (21 upvotes)

Papers citing "Dimple: Discrete Diffusion Multimodal Large Language Model with Parallel Decoding"

50 / 54 papers shown

dVLM-AD: Enhance Diffusion Vision-Language-Model for Driving via Controllable Reasoning

207

04 Dec 2025

Principled RL for Diffusion LLMs Emerges from a Sequence-Level Perspective

135

03 Dec 2025

Beyond Confidence: Adaptive and Coherent Decoding for Diffusion Language Models

339

26 Nov 2025

From Bits to Rounds: Parallel Decoding with Exploration for Diffusion Language Models

237

26 Nov 2025

Masked Diffusion Models are Secretly Learned-Order Autoregressive Models

222

24 Nov 2025

Bringing Stability to Diffusion: Decomposing and Reducing Variance of Training Masked Diffusion Models

106

22 Nov 2025

A Comprehensive Study on Visual Token Redundancy for Discrete Diffusion-based Multimodal Large Language Models

157

19 Nov 2025

Reasoning in Diffusion Large Language Models is Concentrated in Dynamic Confusion Zones

207

19 Nov 2025

$D$^{3}$ToM: Decider-Guided Dynamic Token Merging for Accelerating Diffusion MLLMs$

^{3}

ToM: Decider-Guided Dynamic Token Merging for Accelerating Diffusion MLLMs

15 Nov 2025

KLASS: KL-Guided Fast Inference in Masked Diffusion Models

139

07 Nov 2025

From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model

175

22 Oct 2025

Saber: An Efficient Sampling with Adaptive Acceleration and Backtracking Enhanced Remasking for Diffusion Language Model

...

142

20 Oct 2025

Attention Is All You Need for KV Cache in Diffusion LLMs

Quan Nguyen-Tri

Mukul Ranjan

Zhiqiang Shen

161

16 Oct 2025

Latent Refinement Decoding: Enhancing Diffusion-Based Language Models by Refining Belief States

181

13 Oct 2025

Unlocking the Potential of Diffusion Language Models through Template Infilling

13 Oct 2025

The False Promise of Zero-Shot Super-Resolution in Machine-Learned Operators

294

08 Oct 2025

CreditDecoding: Accelerating Parallel Decoding in Diffusion Large Language Models with Trace Credits

124

07 Oct 2025

LaDiR: Latent Diffusion Enhances LLMs for Text Reasoning

619

06 Oct 2025

Finish First, Perfect Later: Test-Time Token-Level Cross-Validation for Diffusion Large Language Models

164

06 Oct 2025

Free Draft-and-Verification: Toward Lossless Parallel Decoding for Diffusion Large Language Models

Shutong Wu

Jiawei Zhang

DiffM

322

30 Sep 2025

Fast-dLLM v2: Efficient Block-Diffusion LLM

217

30 Sep 2025

AdaBlock-dLLM: Semantic-Aware Diffusion LLM Inference via Adaptive Block Size

152

30 Sep 2025

dParallel: Learnable Parallel Decoding for dLLMs

126

30 Sep 2025

LLaDA-MoE: A Sparse MoE Diffusion Language Model

...

267

29 Sep 2025

RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance

151

29 Sep 2025

RIV: Recursive Introspection Mask Diffusion Vision Language Model

28 Sep 2025

A2D: Any-Order, Any-Step Safety Alignment for Diffusion Language Models

168

27 Sep 2025

Soft-Di[M]O: Improving One-Step Discrete Image Generation with Soft Embeddings

145

26 Sep 2025

From Text to Talk: Audio-Language Model Needs Non-Autoregressive Joint Training

148

24 Sep 2025

Set Block Decoding is a Language Model Inference Accelerator

162

04 Sep 2025

A Survey on Diffusion Language Models

326

14 Aug 2025

Beyond Fixed: Training-Free Variable-Length Denoising for Diffusion Large Language Models

181

01 Aug 2025

LongLLaDA: Unlocking Long Context Capabilities in Diffusion LLMs

442

17 Jun 2025

Discrete Diffusion in Large Language and Multimodal Models: A Survey

540

16 Jun 2025

Joint Vision-Language Social Bias Removal for CLIPComputer Vision and Pattern Recognition (CVPR), 2024

429

19 Nov 2024

Scaling Diffusion Language Models via Adaptation from Autoregressive ModelsInternational Conference on Learning Representations (ICLR), 2024

...

423

145

23 Oct 2024

Beyond Autoregression: Discrete Diffusion for Complex Reasoning and PlanningInternational Conference on Learning Representations (ICLR), 2024

647

18 Oct 2024

How Far Are We to GPT-4V? Closing the Gap to Commercial Multimodal Models with Open-Source Suites

...

Dahua Lin

Yu Qiao

Jifeng Dai

Wenhai Wang

MLLM VLM

534

1,004

25 Apr 2024

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGIComputer Vision and Pattern Recognition (CVPR), 2023

...

869

1,649

27 Nov 2023

Discrete Diffusion Modeling by Estimating the Ratios of the Data DistributionInternational Conference on Machine Learning (ICML), 2023

445

335

25 Oct 2023

Improved Baselines with Visual Instruction TuningComputer Vision and Pattern Recognition (CVPR), 2023

616

4,263

05 Oct 2023

MathVista: Evaluating Mathematical Reasoning of Foundation Models in Visual ContextsInternational Conference on Learning Representations (ICLR), 2023

577

1,198

03 Oct 2023

Qwen-VL: A Versatile Vision-Language Model for Understanding, Localization, Text Reading, and Beyond

Jinze Bai

Shuai Bai

Shusheng Yang

Shijie Wang

Sinan Tan

Peng Wang

Junyang Lin

Chang Zhou

Jingren Zhou

MLLM VLM ObjD

547

1,632

24 Aug 2023

MMBench: Is Your Multi-modal Model an All-around Player?European Conference on Computer Vision (ECCV), 2023

...

Conghui He

Ziwei Liu

Kai-xiang Chen

Dahua Lin

762

1,685

12 Jul 2023

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

...

815

1,252

23 Jun 2023

Evaluating Object Hallucination in Large Vision-Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

691

1,287

17 May 2023

Visual Instruction TuningNeural Information Processing Systems (NeurIPS), 2023

1.2K

7,615

17 Apr 2023

A Reparameterized Discrete Diffusion Model for Text Generation

Lin Zheng

Jianbo Yuan

Lei Yu

Lingpeng Kong

DiffM

289

119

11 Feb 2023

SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers

Hongyi Yuan

Zheng Yuan

Chuanqi Tan

Fei Huang

Songfang Huang

DiffM

252

20 Dec 2022

CLIP-Diffusion-LM: Apply Diffusion Model on Image Captioning

Shi-You Xu

VLM DiffM

204

10 Oct 2022