v1v2 (latest)

LeViT: a Vision Transformer in ConvNet's Clothing for Faster Inference

IEEE International Conference on Computer Vision (ICCV), 2021

2 April 2021

Ben Graham

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)Github (612★)

Papers citing "LeViT: a Vision Transformer in ConvNet's Clothing for Faster Inference"

50 / 327 papers shown

Performance Evaluation of Deep Learning for Tree Branch Segmentation in Autonomous Forestry SystemsImage and Vision Computing New Zealand (IVCNZ), 2025

197

05 Dec 2025

DisentangleFormer: Spatial-Channel Decoupling for Multi-Channel Vision

167

03 Dec 2025

nnMobileNet++: Towards Efficient Hybrid Networks for Retinal Image Analysis

195

01 Dec 2025

Energy-Efficient Vision Transformer Inference for Edge-AI Deployment

Nursultan Amanzhol

Jurn-Gyu Park

207

28 Nov 2025

AutoTailor: Automatic and Efficient Adaptive Model Deployment for Diverse Edge Devices

116

27 Nov 2025

DMSORT: An efficient parallel maritime multi-object tracking architecture for unmanned vessel platformsOcean Engineering (Ocean Eng.), 2025

690

06 Nov 2025

Integrating ConvNeXt and Vision Transformers for Enhancing Facial Age EstimationComputer Vision and Image Understanding (CVIU), 2025

Gaby Maroun

Salah Eddine Bekhouche

Fadi Dornaika

ViT

154

31 Oct 2025

Alias-Free ViT: Fractional Shift Invariance via Linear Attention

H. Michaeli

Daniel Soudry

227

26 Oct 2025

WaveSeg: Enhancing Segmentation Precision via High-Frequency Prior and Mamba-Driven Spectrum Decomposition

265

24 Oct 2025

Multi-Scale High-Resolution Logarithmic Grapher Module for Efficient Vision GNNs

Mustafa Munir

Alex Zhang

R. Marculescu

210

15 Oct 2025

BioAutoML-NAS: An End-to-End AutoML Framework for Multimodal Insect Classification via Neural Architecture Search on Large-Scale Biodiversity Data

Arefin Ittesafun Abian

193

07 Oct 2025

MER-Inspector: Assessing model extraction risks from an attack-agnostic perspective

426

23 Sep 2025

Optimizing Product Deduplication in E-Commerce with Multimodal Embeddings

224

19 Sep 2025

Leveraging Geometric Visual Illusions as Perceptual Inductive Biases for Vision Models

167

18 Sep 2025

Image Quality Assessment for Machines: Paradigm, Large-scale Database, and Models

Xiaoqi Wang

Yun Zhang

Weisi Lin

234

27 Aug 2025

NAT: Learning to Attack Neurons for Enhanced Adversarial TransferabilityIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

Krishna Kanth Nakka

Alexandre Alahi

AAML

190

23 Aug 2025

Vision encoders should be image size agnostic and task driven

180

22 Aug 2025

The Maximum Coverage Model and Recommendation System for UAV Vertiports Location Planning

263

18 Aug 2025

ViT-EnsembleAttack: Augmenting Ensemble Models for Stronger Adversarial Transferability in Vision Transformers

239

17 Aug 2025

CoCAViT: Compact Vision Transformer with Robust Global Coordination

188

07 Aug 2025

Representation Shift: Unifying Token Compression with FlashAttention

248

01 Aug 2025

A Survey of Token Compression for Efficient Multimodal Large Language Models

721

27 Jul 2025

Modality Agnostic Efficient Long Range Encoder

T. Parag

Ahmed Elgammal

203

25 Jul 2025

RAM-W600: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis

294

07 Jul 2025

Boosting Generative Adversarial Transferability with Self-supervised Vision Transformer Features

268

26 Jun 2025

Attention-based Adversarial Robust Distillation in Radio Signal Classifications for Low-Power IoT DevicesIEEE Internet of Things Journal (IEEE IoT J.), 2023

236

13 Jun 2025

DeepTraverse: A Depth-First Search Inspired Network for Algorithmic Visual Understanding

Bin Guo

John H.L. Hansen

307

11 Jun 2025

Efficient Egocentric Action Recognition with Multimodal Data

384

02 Jun 2025

TESSER: Transfer-Enhancing Adversarial Attacks from Vision Transformers via Spectral and Semantic Regularization

541

26 May 2025

AnchorFormer: Differentiable Anchor Attention for Efficient Vision TransformerPattern Recognition Letters (Pattern Recogn. Lett.), 2025

860

22 May 2025

MSVIT: Improving Spiking Vision Transformer Using Multi-scale Attention FusionInternational Joint Conference on Artificial Intelligence (IJCAI), 2025

452

19 May 2025

CGTrack: Cascade Gating Network with Hierarchical Feature Aggregation for UAV TrackingIEEE International Conference on Robotics and Automation (ICRA), 2025

280

09 May 2025

Adaptive Data-Resilient Multi-Modal Hierarchical Multi-Label Book Genre Identification

400

05 May 2025

Optimal Hyperspectral Undersampling Strategy for Satellite Imaging

Vita V. Vlasova

Vladimir G. Kuzmin

Maria S. Varetsa

Natalia A. Ibragimova

Oleg Y. Rogov

Elena V. Lyapuntsova

314

27 Apr 2025

RaPA: Enhancing Transferable Targeted Attacks via Random Parameter Pruning

477

24 Apr 2025

ECViT: Efficient Convolutional Vision Transformer with Local-Attention and Multi-scale Stages

Zhoujie Qian

ViT

318

21 Apr 2025

BeetleVerse: A Study on Taxonomic Classification of Ground Beetles

273

18 Apr 2025

EDIT: Enhancing Vision Transformers by Mitigating Attention Sink through an Encoder-Decoder Architecture

395

09 Apr 2025

Efficient Token Compression for Vision Transformer with Spatial Information Preserved

474

30 Mar 2025

GmNet: Revisiting Gating Mechanisms From A Frequency View

391

28 Mar 2025

Deepfake Detection via Knowledge Injection

382

04 Mar 2025

Two-stream Beats One-stream: Asymmetric Siamese Network for Efficient Visual TrackingAAAI Conference on Artificial Intelligence (AAAI), 2025

317

01 Mar 2025

Escaping The Big Data Paradigm in Self-Supervised Representation Learning

Carlos Vélez García

Miguel Cazorla

Jorge Pomares

288

25 Feb 2025

MaxGlaViT: A novel lightweight vision transformer-based approach for early diagnosis of glaucoma stages from fundus images

Mustafa Yurdakul

Kubra Uyar

Şakir Tasdemir

334

24 Feb 2025

Dual-Flow: Transferable Multi-Target, Instance-Agnostic Attacks via In-the-wild Cascading Flow Optimization

788

04 Feb 2025

Parallel Sequence Modeling via Generalized Spatial Propagation NetworkComputer Vision and Pattern Recognition (CVPR), 2025

877

21 Jan 2025

RecConv: Efficient Recursive Convolutions for Multi-Frequency Representations

Mingshu Zhao

Yi Luo

Yong Ouyang

387

27 Dec 2024

Cascaded Multi-Scale Attention for Enhanced Multi-Scale Feature Extraction and Interaction with Low-Resolution Images

Xiangyong Lu

Masanori Suganuma

Takayuki Okatani

523

03 Dec 2024

Improving Transferable Targeted Attacks with Feature Tuning MixupComputer Vision and Pattern Recognition (CVPR), 2024

1.2K

23 Nov 2024

SAG-ViT: A Scale-Aware, High-Fidelity Patching Approach with Graph Attention for Vision Transformers

572

14 Nov 2024