Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2505.21334
Cited By

HoliTom: Holistic Token Merging for Fast Video Large Language Models

v1v2v3 (latest)

HoliTom: Holistic Token Merging for Fast Video Large Language Models

27 May 2025

ArXiv (abs)PDF HTML HuggingFace (19 upvotes)Github (48★)

Papers citing "HoliTom: Holistic Token Merging for Fast Video Large Language Models"

19 / 19 papers shown

UniComp: Rethinking Video Compression Through Informational Uniqueness

UniComp: Rethinking Video Compression Through Informational Uniqueness

168

0

0

03 Dec 2025

Accelerating Streaming Video Large Language Models via Hierarchical Token Compression

63

0

0

30 Nov 2025

Unboxing the Black Box: Mechanistic Interpretability for Algorithmic Understanding of Neural Networks

Unboxing the Black Box: Mechanistic Interpretability for Algorithmic Understanding of Neural Networks

Bianka Kowalska

Halina Kwaśnicka

179

0

0

24 Nov 2025

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

OmniZip: Audio-Guided Dynamic Token Compression for Fast Omnimodal Large Language Models

255

2

0

18 Nov 2025

StreamingTOM: Streaming Token Compression for Efficient Video Understanding

StreamingTOM: Streaming Token Compression for Efficient Video Understanding

199

3

0

21 Oct 2025

MANI-Pure: Magnitude-Adaptive Noise Injection for Adversarial Purification

MANI-Pure: Magnitude-Adaptive Noise Injection for Adversarial Purification

189

0

0

29 Sep 2025

Revisiting MLLM Token Technology through the Lens of Classical Visual Coding

Revisiting MLLM Token Technology through the Lens of Classical Visual Coding

141

3

0

19 Aug 2025

TARS: MinMax Token-Adaptive Preference Strategy for MLLM Hallucination Reduction

TARS: MinMax Token-Adaptive Preference Strategy for MLLM Hallucination Reduction

287

0

0

29 Jul 2025

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios

521

12

0

27 Jul 2025

DyMU: Dynamic Merging and Virtual Unmerging for Efficient VLMs

DyMU: Dynamic Merging and Virtual Unmerging for Efficient VLMs

Senthil Purushwalkam

382

5

0

23 Apr 2025

TopV: Compatible Token Pruning with Inference Time Optimization for Fast and Low-Memory Multimodal Vision Language Model

TopV: Compatible Token Pruning with Inference Time Optimization for Fast and Low-Memory Multimodal Vision Language ModelComputer Vision and Pattern Recognition (CVPR), 2025

...

468

18

0

24 Mar 2025

Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models

Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models

380

8

0

20 Mar 2025

FastVID: Dynamic Density Pruning for Fast Video Large Language Models

FastVID: Dynamic Density Pruning for Fast Video Large Language Models

410

14

0

14 Mar 2025

Qwen2.5-VL Technical Report

Qwen2.5-VL Technical Report

...

720

2,913

0

20 Feb 2025

Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and ReactionComputer Vision and Pattern Recognition (CVPR), 2025

258

31

0

06 Jan 2025

FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance

FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance

Gabriele Spadaro

Enzo Tartaglione

Enzo Tartaglione

970

15

0

05 Jan 2025

PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction

PyramidDrop: Accelerating Your Large Vision-Language Models via Pyramid Visual Redundancy Reduction

...

Yuhang Cao

Jiaqi Wang

337

133

0

22 Oct 2024

TempMe: Video Temporal Token Merging for Efficient Text-Video Retrieval

TempMe: Video Temporal Token Merging for Efficient Text-Video RetrievalInternational Conference on Learning Representations (ICLR), 2024

Tao He

Sicheng Zhao

Guiguang Ding

451

32

0

02 Sep 2024

Towards Adversarial Robustness via Debiased High-Confidence Logit Alignment

Towards Adversarial Robustness via Debiased High-Confidence Logit Alignment

366

1

0

12 Aug 2024

Page 1 of 1