v1v2 (latest)

Vision Transformer Slimming: Multi-Dimension Searching in Continuous Optimization Space

Computer Vision and Pattern Recognition (CVPR), 2022

3 January 2022

ArXiv (abs)PDF HTML Github (249★)

Papers citing "Vision Transformer Slimming: Multi-Dimension Searching in Continuous Optimization Space"

50 / 53 papers shown

One-Shot Knowledge Transfer for Scalable Person Re-Identification

Longhua Li

Lei Qi

Xin Geng

195

08 Nov 2025

General Compression Framework for Efficient Transformer Object Tracking

...

371

01 Jul 2025

How to Train Your Metamorphic Deep Neural Network

Thomas Sommariva

Simone Calderara

Angelo Porrello

275

07 May 2025

AdaVid: Adaptive Video-Language Pretraining

251

16 Apr 2025

Discovering Influential Neuron Path in Vision TransformersInternational Conference on Learning Representations (ICLR), 2025

663

12 Mar 2025

Neural MetamorphosisEuropean Conference on Computer Vision (ECCV), 2024

Xingyi Yang

Xinchao Wang

389

10 Oct 2024

HydraViT: Stacking Heads for a Scalable ViTNeural Information Processing Systems (NeurIPS), 2024

Janek Haberer

A. Hojjat

Olaf Landsiedel

260

26 Sep 2024

OATS: Outlier-Aware Pruning Through Sparse and Low Rank DecompositionInternational Conference on Learning Representations (ICLR), 2024

Stephen Zhang

Vardan Papyan

VLM

719

20 Sep 2024

Agglomerative Token ClusteringEuropean Conference on Computer Vision (ECCV), 2024

Joakim Bruslund Haurum

Sergio Escalera

Graham W. Taylor

T. Moeslund

352

18 Sep 2024

Vote&Mix: Plug-and-Play Token Reduction for Efficient Vision Transformer

Di Fu

Yong Cao

245

30 Aug 2024

Token Compensator: Altering Inference Cost of Vision Transformer without Re-TuningEuropean Conference on Computer Vision (ECCV), 2024

Kai Han

254

13 Aug 2024

Efficient Visual Transformer by Learnable Token Merging

Yancheng Wang

Yingzhen Yang

ViT

385

21 Jul 2024

Straightforward Layer-wise Pruning for More Efficient Visual Adaptation

Ruizi Han

Jinglei Tang

361

19 Jul 2024

PRANCE: Joint Token-Optimization and Structural Channel-Pruning for Adaptive ViT Inference

Zhi Wang

Wenwu Zhu

290

06 Jul 2024

Isomorphic Pruning for Vision Models

Gongfan Fang

Xinyin Ma

Michael Bi Mi

Xinchao Wang

VLM ViT

362

05 Jul 2024

Surgical Feature-Space Decomposition of LLMs: Why, When and How?Annual Meeting of the Association for Computational Linguistics (ACL), 2024

Arnav Chavan

Nahush Lele

Deepak Gupta

317

17 May 2024

Efficient Multimodal Large Language Models: A Survey

Yizhang Jin

Jian Li

Yexin Liu

Tianjun Gu

Kai Wu

...

Xin Tan

Zhenye Gan

Yabiao Wang

Chengjie Wang

Lizhuang Ma

LRM

366

104

17 May 2024

Data-independent Module-aware Pruning for Hierarchical Vision Transformers

Yang He

Qiufeng Wang

ViT

319

21 Apr 2024

MULTIFLOW: Shifting Towards Task-Agnostic Vision-Language Pruning

324

08 Apr 2024

Dense Vision Transformer Compression with Few Samples

344

27 Mar 2024

Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer CompressionComputer Vision and Pattern Recognition (CVPR), 2024

Peng Ye

Tao Chen

260

23 Mar 2024

PYRA: Parallel Yielding Re-Activation for Training-Inference Efficient Task AdaptationEuropean Conference on Computer Vision (ECCV), 2024

Hui Chen

Jungong Han

Yongjun Bao

451

14 Mar 2024

MoPE-CLIP: Structured Pruning for Efficient Vision-Language Models with Module-wise Pruning Error MetricComputer Vision and Pattern Recognition (CVPR), 2024

198

12 Mar 2024

MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for Accelerating Vision-Language Transformer

Peng Ye

Tao Chen

255

05 Mar 2024

A Survey on Transformer Compression

584

05 Feb 2024

Faster and Lighter LLMs: A Survey on Current Challenges and Way Forward

384

02 Feb 2024

Bridging The Gaps Between Token Pruning and Full Pre-training via Masked Fine-tuning

Fengyuan Shi

Limin Wang

ViT

251

26 Oct 2023

MatFormer: Nested Transformer for Elastic InferenceNeural Information Processing Systems (NeurIPS), 2023

Tim Dettmers

...

303

11 Oct 2023

TinyCLIP: CLIP Distillation via Affinity Mimicking and Weight InheritanceIEEE International Conference on Computer Vision (ICCV), 2023

...

300

117

21 Sep 2023

Which Tokens to Use? Investigating Token Reduction in Vision Transformers

Joakim Bruslund Haurum

313

09 Aug 2023

A Survey of Techniques for Optimizing Transformer InferenceJournal of systems architecture (JSA), 2023

Krishna Teja Chitty-Venkata

402

141

16 Jul 2023

DiffRate : Differentiable Compression Rate for Efficient Vision TransformersIEEE International Conference on Computer Vision (ICCV), 2023

Yu Qiao

Ping Luo

ViT

252

29 May 2023

CrossGET: Cross-Guided Ensemble of Tokens for Accelerating Vision-Language TransformersInternational Conference on Machine Learning (ICML), 2023

546

27 May 2023

MixFormerV2: Efficient Fully Transformer TrackingNeural Information Processing Systems (NeurIPS), 2023

Yutao Cui

Tian-Shu Song

Gangshan Wu

Liming Wang

291

150

25 May 2023

Spatiotemporal Attention-based Semantic Compression for Real-time Video Recognition

176

22 May 2023

Boost Vision Transformer with GPU-Friendly Sparsity and QuantizationComputer Vision and Pattern Recognition (CVPR), 2023

Tao Chen

262

18 May 2023

Three Guidelines You Should Know for Universally Slimmable Self-Supervised LearningComputer Vision and Pattern Recognition (CVPR), 2023

Yunhao Cao

Peiqin Sun

Shuchang Zhou

178

13 Mar 2023

Efficient Transformer-based 3D Object Detection with Dynamic Token HaltingIEEE International Conference on Computer Vision (ICCV), 2023

304

09 Mar 2023

X-Pruner: eXplainable Pruning for Vision TransformersComputer Vision and Pattern Recognition (CVPR), 2023

Lu Yu

Wei Xiang

ViT

344

08 Mar 2023

Structured Pruning for Deep Convolutional Neural Networks: A surveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yang He

Lingao Xiao

3DPC

475

325

01 Mar 2023

Progressive Ensemble Distillation: Building Ensembles for Efficient InferenceNeural Information Processing Systems (NeurIPS), 2023

315

20 Feb 2023

UPop: Unified and Progressive Pruning for Compressing Vision-Language TransformersInternational Conference on Machine Learning (ICML), 2023

463

31 Jan 2023

Rethinking Vision Transformers for MobileNet Size and SpeedIEEE International Conference on Computer Vision (ICCV), 2022

460

291

15 Dec 2022

On Designing Light-Weight Object Trackers through Network Pruning: Use CNNs or Transformers?IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

219

24 Nov 2022

Data Level Lottery Ticket Hypothesis for Vision TransformersInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

310

02 Nov 2022

Expediting Large-Scale Vision Transformer for Dense Prediction without Fine-tuningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Xiao Luo

350

03 Oct 2022

Slimmable Networks for Contrastive Self-supervised LearningInternational Journal of Computer Vision (IJCV), 2022

Shuai Zhao

Xiaohan Wang

Linchao Zhu

Yi Yang

264

30 Sep 2022

Greybox XAI: a Neural-Symbolic learning framework to produce interpretable predictions for image classificationKnowledge-Based Systems (KBS), 2022

Natalia Díaz Rodríguez

AAML

258

26 Sep 2022

EfficientFormer: Vision Transformers at MobileNet SpeedNeural Information Processing Systems (NeurIPS), 2022

868

576

02 Jun 2022

Spartan: Differentiable Sparsity via Regularized TransportationNeural Information Processing Systems (NeurIPS), 2022

Kai Sheng Tai

Taipeng Tian

Ser-Nam Lim

328

27 May 2022