v1v2 (latest)

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

IEEE International Conference on Computer Vision (ICCV), 2021

25 March 2021

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)Github (14835★)

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

50 / 8,524 papers shown

VesSAM: Efficient Multi-Prompting for Segmenting Complex Vessel

...

Angelica I Aviles-Rivero

Shuguang Cui

Zhen Li

120

02 Nov 2025

HyFormer-Net: A Synergistic CNN-Transformer with Interpretable Multi-Scale Fusion for Breast Lesion Segmentation and Classification in Ultrasound Images

Mohammad Amanour Rahman

ViT MedIm

130

02 Nov 2025

Linear Differential Vision Transformer: Learning Visual Contrasts via Pairwise Differentials

135

02 Nov 2025

Enhancing Frequency Forgery Clues for Diffusion-Generated Image Detection

191

01 Nov 2025

Region-Aware Reconstruction Strategy for Pre-training fMRI Foundation Model

Ruthwik Reddy Doodipala

Pankaj Pandey

Carolina Torres Rojas

Manob Jyoti Saikia

Ranganatha Sitaram

01 Nov 2025

Rethinking Facial Expression Recognition in the Era of Multimodal Large Language Models: Benchmark, Datasets, and Beyond

...

167

01 Nov 2025

Leveraging Hierarchical Image-Text Misalignment for Universal Fake Image Detection

168

01 Nov 2025

Towards Automated Petrography

01 Nov 2025

Hierarchical Fusion of Local and Global Visual Features with Mixture-of-Experts for Remote Sensing Image Scene Classification

154

31 Oct 2025

BeetleFlow: An Integrative Deep Learning Pipeline for Beetle Image Processing

...

31 Oct 2025

Hierarchical Transformers for Unsupervised 3D Shape Abstraction

113

31 Oct 2025

Foundation Models for Trajectory Planning in Autonomous Driving: A Review of Progress and Open Challenges

102

31 Oct 2025

FedAdamW: A Communication-Efficient Optimizer with Convergence and Generalization Guarantees for Federated Large Models

Kewen Zhu

Zhouchen Lin

FedML

201

31 Oct 2025

FedMuon: Accelerating Federated Learning with Matrix Orthogonalization

224

31 Oct 2025

$SA$^{2}$Net: Scale-Adaptive Structure-Affinity Transformation for Spine Segmentation from Ultrasound Volume Projection Imaging$

^{2}

Net: Scale-Adaptive Structure-Affinity Transformation for Spine Segmentation from Ultrasound Volume Projection Imaging

30 Oct 2025

SYNAPSE-Net: A Unified Framework with Lesion-Aware Hierarchical Gating for Robust Segmentation of Heterogeneous Brain Lesions

30 Oct 2025

WOD-E2E: Waymo Open Dataset for End-to-End Driving in Challenging Long-tail Scenarios

...

394

30 Oct 2025

Incremental Human-Object Interaction Detection with Invariant Relation Representation Learning

153

30 Oct 2025

SPG-CDENet: Spatial Prior-Guided Cross Dual Encoder Network for Multi-Organ Segmentation

126

30 Oct 2025

ConceptScope: Characterizing Dataset Bias via Disentangled Visual Concepts

148

30 Oct 2025

PF-DAformer: Proximal Femur Segmentation via Domain Adaptive Transformer for Dual-Center QCT

145

30 Oct 2025

Hallucinations in Bibliographic Recommendation: Citation Frequency as a Proxy for Training Data Redundancy

Junichiro Niimi

HILM RALM

186

29 Oct 2025

DRIP: Dynamic patch Reduction via Interpretable Pooling

Yusen Peng

Sachin Kumar

VLM

285

29 Oct 2025

Energy-Efficient Autonomous Driving with Adaptive Perception and Robust Decision

129

29 Oct 2025

A Study on Inference Latency for Vision Transformers on Mobile Devices

Zhuojin Li

Marco Paolieri

L. Golubchik

29 Oct 2025

Classifier Enhancement Using Extended Context and Domain Experts for Semantic Segmentation

29 Oct 2025

Leveraging an Atmospheric Foundational Model for Subregional Sea Surface Temperature Forecasting

446

29 Oct 2025

SPADE: Sparsity Adaptive Depth Estimator for Zero-Shot, Real-Time, Monocular Depth Estimation in Underwater Environments

188

29 Oct 2025

Test-Time Adaptive Object Detection with Foundation Model

334

29 Oct 2025

BSFA: Leveraging the Subspace Dichotomy to Accelerate Neural Network Training

132

29 Oct 2025

Synthetic Data Reveals Generalization Gaps in Correlated Multiple Instance Learning

198

29 Oct 2025

Unlocking Out-of-Distribution Generalization in Dynamics through Physics-Guided Augmentation

105

28 Oct 2025

UHKD: A Unified Framework for Heterogeneous Knowledge Distillation via Frequency-Domain Representations

164

28 Oct 2025

FT-ARM: Fine-Tuned Agentic Reflection Multimodal Language Model for Pressure Ulcer Severity Classification with Reasoning

28 Oct 2025

HiMAE: Hierarchical Masked Autoencoders Discover Resolution-Specific Structure in Wearable Time Series

...

Subramaniam Venkatraman

Sharanya Arcot Desai

127

28 Oct 2025

Decoupling What to Count and Where to See for Referring Expression Counting

Yuda Zou

Zijian Zhang

Yongchao Xu

116

28 Oct 2025

Enhancing Pre-trained Representation Classifiability can Boost its InterpretabilityInternational Conference on Learning Representations (ICLR), 2025

422

28 Oct 2025

Hammering the Diagnosis: Rowhammer-Induced Stealthy Trojan Attacks on ViT-Based Medical Imaging

106

28 Oct 2025

Kernelized Sparse Fine-Tuning with Bi-level Parameter Competition for Vision Models

147

28 Oct 2025

Deep Feature Optimization for Enhanced Fish Freshness Assessment

28 Oct 2025

A Survey on Efficient Vision-Language-Action Models

219

27 Oct 2025

Revealing the Potential of Learnable Perturbation Ensemble Forecast Model for Tropical Cyclone Prediction

296

27 Oct 2025

Provable test-time adaptivity and distributional robustness of in-context learning

Tianyi Ma

Tengyao Wang

R. Samworth

110

27 Oct 2025

Progressive Growing of Patch Size: Curriculum Learning for Accelerated and Improved Medical Image Segmentation

204

27 Oct 2025

Implicit Modeling for Transferability Estimation of Vision Foundation Models

170

27 Oct 2025

Transforming volcanic monitoring: A dataset and benchmark for onboard volcano activity detection

100

27 Oct 2025

DAMap: Distance-aware MapNet for High Quality HD Map Construction

135

26 Oct 2025

From Pixels to Views: Learning Angular-Aware and Physics-Consistent Representations for Light Field Microscopy

107

26 Oct 2025

Alias-Free ViT: Fractional Shift Invariance via Linear Attention

H. Michaeli

Daniel Soudry

189

26 Oct 2025

PSScreen V2: Partially Supervised Multiple Retinal Disease Screening

186

26 Oct 2025