Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2506.07986
Cited By

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

v1v2v3 (latest)

Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers

9 June 2025

Kwan-Yee K. Wong

ArXiv (abs)PDF HTML HuggingFace (19 upvotes)

Papers citing "Rethinking Cross-Modal Interaction in Multimodal Diffusion Transformers"

4 / 4 papers shown

Group Relative Attention Guidance for Image Editing

Group Relative Attention Guidance for Image Editing

210

0

0

28 Oct 2025

Towards Relaxed Multimodal Inputs for Gait-based Parkinson's Disease Assessment

Towards Relaxed Multimodal Inputs for Gait-based Parkinson's Disease Assessment

Martin J. McKeown

168

0

0

17 Oct 2025

JEPA-T: Joint-Embedding Predictive Architecture with Text Fusion for Image Generation

JEPA-T: Joint-Embedding Predictive Architecture with Text Fusion for Image Generation

...

111

0

0

01 Oct 2025

UniVid: The Open-Source Unified Video Model

UniVid: The Open-Source Unified Video Model

283

8

0

29 Sep 2025