v1v2 (latest)

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

IEEE International Conference on Computer Vision (ICCV), 2021

25 March 2021

ArXiv (abs)PDF HTML HuggingFace (5 upvotes)Github (14835★)

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

50 / 8,525 papers shown

Transformed CNNs: recasting pre-trained convolutional layers with self-attention

106

10 Jun 2021

CAT: Cross Attention in Vision TransformerIEEE International Conference on Multimedia and Expo (ICME), 2021

Fan Yang

187

260

10 Jun 2021

MST: Masked Self-Supervised Transformer for Visual RepresentationNeural Information Processing Systems (NeurIPS), 2021

Fan Yang

...

Ming Tang

239

178

10 Jun 2021

Knowledge distillation: A good teacher is patient and consistentComputer Vision and Pattern Recognition (CVPR), 2021

392

363

09 Jun 2021

Do Transformers Really Perform Bad for Graph Representation?

Tianle Cai

559

521

09 Jun 2021

CoAtNet: Marrying Convolution and Attention for All Data SizesNeural Information Processing Systems (NeurIPS), 2021

Mingxing Tan

584

1,478

09 Jun 2021

TED-net: Convolution-free T2T Vision Transformer-based Encoder-decoder Dilation network for Low-dose CT Denoising

Dayang Wang

Zhan Wu

Hengyong Yu

ViT MedIm

211

08 Jun 2021

A Survey of TransformersAI Open (AO), 2021

Tianyang Lin

Yuxin Wang

Xiangyang Liu

Xipeng Qiu

ViT

456

1,396

08 Jun 2021

On the Connection between Local Attention and Dynamic Depth-wise ConvolutionInternational Conference on Learning Representations (ICLR), 2021

Ming-Ming Cheng

Jingdong Wang

366

133

08 Jun 2021

On Improving Adversarial Transferability of Vision TransformersInternational Conference on Learning Representations (ICLR), 2021

Salman Khan

Fatih Porikli

262

107

08 Jun 2021

Fully Transformer Networks for Semantic Image Segmentation

289

08 Jun 2021

Generative Flows with Invertible AttentionsComputer Vision and Pattern Recognition (CVPR), 2021

R. Sukthanker

Zhiwu Huang

Suryansh Kumar

Radu Timofte

Luc Van Gool

354

07 Jun 2021

Efficient Training of Visual Transformers with Small DatasetsNeural Information Processing Systems (NeurIPS), 2021

Wei Bi

194

215

07 Jun 2021

Refiner: Refining Self-attention for Vision Transformers

Weihao Yu

232

07 Jun 2021

Shuffle Transformer: Rethinking Spatial Shuffle for Vision Transformer

276

208

07 Jun 2021

Self-supervised Depth Estimation Leveraging Global Perception and Geometric Smoothness Using On-board Videos

158

07 Jun 2021

ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive BiasNeural Information Processing Systems (NeurIPS), 2021

Qiming Zhang

451

396

07 Jun 2021

Vision Transformers with Hierarchical AttentionMachine Intelligence Research (MIR), 2021

Le Zhang

Luc Van Gool

184

06 Jun 2021

Large-scale Unsupervised Semantic SegmentationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Ming-Hsuan Yang

Junwei Han

375

118

06 Jun 2021

Rethinking Training from Scratch for Object Detection

152

06 Jun 2021

Uformer: A General U-Shaped Transformer for Image RestorationComputer Vision and Pattern Recognition (CVPR), 2021

Zhendong Wang

Xiaodong Cun

Jianmin Bao

512

1,912

06 Jun 2021

Patch Slimming for Efficient Vision TransformersComputer Vision and Pattern Recognition (CVPR), 2021

333

195

05 Jun 2021

Motion Planning Transformers: A Motion Planning Framework for Mobile Robots

163

05 Jun 2021

Signal Transformer: Complex-valued Attention and Meta-Learning for Signal RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

421

05 Jun 2021

ZeroWaste Dataset: Towards Deformable Object Segmentation in Cluttered ScenesComputer Vision and Pattern Recognition (CVPR), 2021

343

04 Jun 2021

RegionViT: Regional-to-Local Attention for Vision TransformersInternational Conference on Learning Representations (ICLR), 2021

486

234

04 Jun 2021

Associating Objects with Transformers for Video Object SegmentationNeural Information Processing Systems (NeurIPS), 2021

Zongxin Yang

Yunchao Wei

Yi Yang

423

349

04 Jun 2021

CATs: Cost Aggregation Transformers for Visual CorrespondenceNeural Information Processing Systems (NeurIPS), 2021

342

117

04 Jun 2021

The Image Local Autoregressive TransformerNeural Information Processing Systems (NeurIPS), 2021

Xiang Li

180

04 Jun 2021

SOLQ: Segmenting Objects by Learning QueriesNeural Information Processing Systems (NeurIPS), 2021

294

134

04 Jun 2021

Glance-and-Gaze Vision TransformerNeural Information Processing Systems (NeurIPS), 2021

165

04 Jun 2021

X-volution: On the unification of convolution and self-attention

154

04 Jun 2021

DynamicViT: Efficient Vision Transformers with Dynamic Token SparsificationNeural Information Processing Systems (NeurIPS), 2021

Wenliang Zhao

Jie Zhou

526

932

03 Jun 2021

Less is More: Sparse Sampling for Dense Reaction Predictions

Yi Yang

149

03 Jun 2021

When Vision Transformers Outperform ResNets without Pre-training or Strong Data AugmentationsInternational Conference on Learning Representations (ICLR), 2021

372

375

03 Jun 2021

Container: Context Aggregation NetworkNeural Information Processing Systems (NeurIPS), 2021

288

02 Jun 2021

You Only Look at One Sequence: Rethinking Transformer in Vision through Object DetectionNeural Information Processing Systems (NeurIPS), 2021

270

386

01 Jun 2021

Exploring the Diversity and Invariance in Yourself for Visual Pre-Training TaskPattern Recognition (Pattern Recogn.), 2021

244

01 Jun 2021

SegFormer: Simple and Efficient Design for Semantic Segmentation with TransformersNeural Information Processing Systems (NeurIPS), 2021

1.2K

7,116

31 May 2021

MSG-Transformer: Exchanging Local Spatial Information by Manipulating Messenger TokensComputer Vision and Pattern Recognition (CVPR), 2021

231

31 May 2021

Analogous to Evolutionary Algorithm: Designing a Unified Sequence ModelNeural Information Processing Systems (NeurIPS), 2021

Jiangning Zhang

Chao Xu

Jian Li

Wenzhou Chen

Yabiao Wang

Ying Tai

Shuo Chen

Chengjie Wang

Feiyue Huang

Yong Liu

288

31 May 2021

SDNet: mutil-branch for single image deraining using swin

Yurong Qian

165

31 May 2021

Not All Images are Worth 16x16 Words: Dynamic Transformers for Efficient Image RecognitionNeural Information Processing Systems (NeurIPS), 2021

Yulin Wang

Gao Huang

285

234

31 May 2021

Predicting Driver Intention Using Deep Neural Network

Mahdi Bonyani

Mina Rahmanian

Simindokht Jahangard

117

31 May 2021

Dual-stream Network for Visual RecognitionNeural Information Processing Systems (NeurIPS), 2021

Errui Ding

282

31 May 2021

StyTr

^2

: Image Style Transfer with TransformersComputer Vision and Pattern Recognition (CVPR), 2021

395

369

30 May 2021

TransMatcher: Deep Image Matching Through Transformers for Generalizable Person Re-identificationNeural Information Processing Systems (NeurIPS), 2021

Tianran Ouyang

Ling Shao

ViT

260

30 May 2021

Gaze Estimation using TransformerInternational Conference on Pattern Recognition (ICPR), 2021

Yihua Cheng

Feng Lu

ViT

226

136

30 May 2021

Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive OverviewACM Computing Surveys (CSUR), 2021

Jun He

370

101

29 May 2021

Less is More: Pay Less Attention in Vision TransformersAAAI Conference on Artificial Intelligence (AAAI), 2021

Zizheng Pan

Bohan Zhuang

Haoyu He

Jing Liu

Jianfei Cai

ViT

349

102

29 May 2021