v1v2 (latest)

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

IEEE International Conference on Computer Vision (ICCV), 2021

25 March 2021

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)Github (14835★)

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

50 / 8,530 papers shown

StyTr

^2

: Image Style Transfer with TransformersComputer Vision and Pattern Recognition (CVPR), 2021

398

369

30 May 2021

TransMatcher: Deep Image Matching Through Transformers for Generalizable Person Re-identificationNeural Information Processing Systems (NeurIPS), 2021

Tianran Ouyang

Ling Shao

ViT

260

30 May 2021

Gaze Estimation using TransformerInternational Conference on Pattern Recognition (ICPR), 2021

Yihua Cheng

Feng Lu

ViT

226

137

30 May 2021

Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive OverviewACM Computing Surveys (CSUR), 2021

Jun He

376

101

29 May 2021

Less is More: Pay Less Attention in Vision TransformersAAAI Conference on Artificial Intelligence (AAAI), 2021

Zizheng Pan

Bohan Zhuang

Haoyu He

Jing Liu

Jianfei Cai

ViT

349

104

29 May 2021

Augmenting Anchors by the Detector ItselfInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Yujiu Yang

108

28 May 2021

PTNet: A High-Resolution Infant MRI Synthesizer Based on Transformer

126

28 May 2021

ResT: An Efficient Transformer for Visual RecognitionNeural Information Processing Systems (NeurIPS), 2021

Qing-Long Zhang

Yubin Yang

ViT

410

282

28 May 2021

KVT: k-NN Attention for Boosting Vision TransformersEuropean Conference on Computer Vision (ECCV), 2021

Hao Li

263

130

28 May 2021

Recent advances and clinical applications of deep learning in medical image analysis

439

821

27 May 2021

Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual UnderstandingAAAI Conference on Artificial Intelligence (AAAI), 2021

Tomas Pfister

357

208

26 May 2021

Oriented RepPoints for Aerial Object DetectionComputer Vision and Pattern Recognition (CVPR), 2021

547

429

24 May 2021

FineAction: A Fine-Grained Video Dataset for Temporal Action LocalizationIEEE Transactions on Image Processing (TIP), 2021

Yu Qiao

295

24 May 2021

Intriguing Properties of Vision TransformersNeural Information Processing Systems (NeurIPS), 2021

Salman Khan

Ming-Hsuan Yang

687

755

21 May 2021

Content-Augmented Feature Pyramid Network with Light Linear Spatial Transformers for Object DetectionIET Image Processing (IET Image Process.), 2021

233

20 May 2021

I2C2W: Image-to-Character-to-Word Transformers for Accurate Scene Text RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

336

18 May 2021

Pay Attention to MLPsNeural Information Processing Systems (NeurIPS), 2021

624

807

17 May 2021

Towards Robust Vision TransformerComputer Vision and Pattern Recognition (CVPR), 2021

466

234

17 May 2021

Vision Transformers are Robust LearnersAAAI Conference on Artificial Intelligence (AAAI), 2021

Sayak Paul

Pin-Yu Chen

ViT

380

356

17 May 2021

Unsupervised MRI Reconstruction via Zero-Shot Learned Adversarial TransformersIEEE Transactions on Medical Imaging (IEEE TMI), 2021

356

228

15 May 2021

Segmenter: Transformer for Semantic SegmentationIEEE International Conference on Computer Vision (ICCV), 2021

776

1,803

12 May 2021

Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation

411

4,342

12 May 2021

A Large-Scale Benchmark for Food Image SegmentationACM Multimedia (ACM MM), 2021

177

102

12 May 2021

Hierarchical RNNs-Based Transformers MADDPG for Mixed Cooperative-Competitive EnvironmentsJournal of Intelligent & Fuzzy Systems (JIFS), 2021

201

11 May 2021

Self-Supervised Learning with Swin Transformers

304

205

10 May 2021

You Only Learn One Representation: Unified Network for Multiple TasksJournal of information science and engineering (JISE), 2021

367

565

10 May 2021

MOTR: End-to-End Multiple-Object Tracking with TransformerEuropean Conference on Computer Vision (ECCV), 2021

589

698

07 May 2021

A State-of-the-art Survey of Object Detection Techniques in Microorganism Image Analysis: From Classical Methods to Deep Learning ApproachesArtificial Intelligence Review (AIR), 2021

198

07 May 2021

Do You Even Need Attention? A Stack of Feed-Forward Layers Does Surprisingly Well on ImageNet

Luke Melas-Kyriazi

ViT

122

116

06 May 2021

Beyond Self-attention: External Attention using Two Linear Layers for Visual TasksIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

232

640

05 May 2021

Attention for Image Registration (AiR): an unsupervised Transformer approach

Zihao Wang

H. Delingette

ViT MedIm

118

05 May 2021

Instances as QueriesIEEE International Conference on Computer Vision (ICCV), 2021

Shusheng Yang

Ying Shan

367

311

05 May 2021

TransHash: Transformer-based Hamming Hashing for Efficient Image RetrievalInternational Conference on Multimedia Retrieval (ICMR), 2021

Zhengwei Qi Shanghai Jiao Tong University

ViT

173

05 May 2021

AGMB-Transformer: Anatomy-Guided Multi-Branch Transformer Network for Automated Evaluation of Root Canal TherapyIEEE journal of biomedical and health informatics (JBHI), 2021

...

302

02 May 2021

SVT-Net: Super Light-Weight Sparse Voxel Transformer for Large Scale Place RecognitionAAAI Conference on Artificial Intelligence (AAAI), 2021

Jun He

445

01 May 2021

Twins: Revisiting the Design of Spatial Attention in Vision TransformersNeural Information Processing Systems (NeurIPS), 2021

Chunhua Shen

666

1,232

28 Apr 2021

Self-distillation with Batch Knowledge Ensembling Improves ImageNet Classification

331

27 Apr 2021

Vision Transformers with Patch Diversification

257

26 Apr 2021

Visformer: The Vision-friendly TransformerIEEE International Conference on Computer Vision (ICCV), 2021

536

275

26 Apr 2021

A Novel Transformer Based Semantic Segmentation Scheme for Fine-Resolution Remote Sensing ImagesIEEE Geoscience and Remote Sensing Letters (GRSL), 2021

436

350

25 Apr 2021

A Survey of Modern Deep Learning based Object Detection Models

Syed Sahil Abbas Zaidi

357

846

24 Apr 2021

VidTr: Video Transformer Without ConvolutionsIEEE International Conference on Computer Vision (ICCV), 2021

Hao Chen

429

220

23 Apr 2021

Multiscale Vision TransformersIEEE International Conference on Computer Vision (ICCV), 2021

Christoph Feichtenhofer

ViT

483

1,527

22 Apr 2021

All Tokens Matter: Token Labeling for Training Better Vision TransformersNeural Information Processing Systems (NeurIPS), 2021

403

237

22 Apr 2021

Generative Transformer for Accurate and Reliable Salient Object Detection

Yuchao Dai

461

20 Apr 2021

CTNet: Context-based Tandem Network for Semantic SegmentationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Zechao Li

Yanpeng Sun

Jinhui Tang

168

225

20 Apr 2021

Vision Transformer Pruning

494

113

17 Apr 2021

Co-Scale Conv-Attentional Image TransformersIEEE International Conference on Computer Vision (ICCV), 2021

287

437

13 Apr 2021

Deepfake Detection Scheme Based on Vision Transformer and Distillation

188

03 Apr 2021

Bridging Global Context Interactions for High-Fidelity Image CompletionComputer Vision and Pattern Recognition (CVPR), 2021

Jianfei Cai

175

102

02 Apr 2021