Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

25 March 2021

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

50 / 2,465 papers shown

Title
Restormer: Efficient Transformer for High-Resolution Image Restoration Syed Waqas Zamir Aditya Arora Salman Khan Munawar Hayat F. Khan Ming-Hsuan Yang ViT 32 2,120 0 18 Nov 2021
Evaluating Transformers for Lightweight Action Recognition Raivo Koot Markus Hennerbichler Haiping Lu ViT 28 8 0 18 Nov 2021
Fast and Light-Weight Network for Single Frame Structured Illumination Microscopy Super-Resolution Xi Cheng Jun Li Q. Dai Zhenyong Fu Jian Yang 25 18 0 17 Nov 2021
Achieving Human Parity on Visual Question Answering Ming Yan Haiyang Xu Chenliang Li Junfeng Tian Bin Bi ... Ji Zhang Songfang Huang Fei Huang Luo Si Rong Jin 24 12 0 17 Nov 2021
Occluded Video Instance Segmentation: Dataset and ICCV 2021 Challenge Jiyang Qi Yan Gao Yao Hu Xinggang Wang Xiaoyu Liu Xiang Bai Serge J. Belongie Alan Yuille Philip H. S. Torr S. Bai VOS 27 6 0 15 Nov 2021
iBOT: Image BERT Pre-Training with Online Tokenizer Jinghao Zhou Chen Wei Huiyu Wang Wei Shen Cihang Xie Alan Yuille Tao Kong 19 709 0 15 Nov 2021
Searching for TrioNet: Combining Convolution with Local and Global Self-Attention Huaijin Pi Huiyu Wang Yingwei Li Zizhang Li Alan Yuille ViT 21 3 0 15 Nov 2021
Full-attention based Neural Architecture Search using Context Auto-regression Yuan Zhou Haiyang Wang Shuwei Huo Boyu Wang 25 3 0 13 Nov 2021
A Survey of Visual Transformers Yang Liu Yao Zhang Yixin Wang Feng Hou Jin Yuan Jiang Tian Yang Zhang Zhongchao Shi Jianping Fan Zhiqiang He 3DGS ViT 71 330 0 11 Nov 2021
Improving Visual Quality of Image Synthesis by A Token-based Generator with Transformers Yanhong Zeng Huan Yang Hongyang Chao Jianbo Wang Jianlong Fu ViT 27 26 0 05 Nov 2021
Hepatic vessel segmentation based on 3D swin-transformer with inductive biased multi-head self-attention Mian Wu Yinling Qian Xiangyun Liao Qiong Wang Pheng-Ann Heng MedIm 89 29 0 05 Nov 2021
Bootstrap Your Object Detector via Mixed Training Mengde Xu Zheng-Wei Zhang Fangyun Wei Yutong Lin Yue Cao Stephen Lin Han Hu Xiang Bai ObjD 19 6 0 04 Nov 2021
LVIS Challenge Track Technical Report 1st Place Solution: Distribution Balanced and Boundary Refinement for Large Vocabulary Instance Segmentation Weifu Fu Congchong Nie Ting Sun J. Liu Tianliang Zhang Yong Liu ISeg 25 5 0 04 Nov 2021
Can Vision Transformers Perform Convolution? Shanda Li Xiangning Chen Di He Cho-Jui Hsieh ViT 35 19 0 02 Nov 2021
MCUNetV2: Memory-Efficient Patch-based Inference for Tiny Deep Learning Ji Lin Wei-Ming Chen Han Cai Chuang Gan Song Han 26 152 0 28 Oct 2021
Blending Anti-Aliasing into Vision Transformer Shengju Qian Hao Shao Yi Zhu Mu Li Jiaya Jia 23 20 0 28 Oct 2021
Dispensed Transformer Network for Unsupervised Domain Adaptation Yunxiang Li Jingxiong Li Ruilong Dan Shuai Wang Kai Jin ... Qianni Zhang Huiyu Zhou Qun Jin Li Wang Yaqi Wang OOD MedIm 17 4 0 28 Oct 2021
3D Object Tracking with Transformer Yubo Cui Zheng Fang Jiayao Shan Zuoxu Gu Sifan Zhou ViT 3DPC 13 59 0 28 Oct 2021
Bolt: Bridging the Gap between Auto-tuners and Hardware-native Performance Jiarong Xing Leyuan Wang Shang Zhang Jack H Chen Ang Chen Yibo Zhu 27 43 0 25 Oct 2021
MVT: Multi-view Vision Transformer for 3D Object Recognition Shuo Chen Tan Yu Ping Li ViT 32 43 0 25 Oct 2021
The Efficiency Misnomer Daoyuan Chen Liuyi Yao Dawei Gao Ashish Vaswani Yaliang Li 32 98 0 25 Oct 2021
SOFT: Softmax-free Transformer with Linear Complexity Jiachen Lu Jinghan Yao Junge Zhang Martin Danelljan Hang Xu Weiguo Gao Chunjing Xu Thomas B. Schon Li Zhang 18 161 0 22 Oct 2021
UVO Challenge on Video-based Open-World Segmentation 2021: 1st Place Solution Yuming Du Wenqian. Guo Yang Xiao Vincent Lepetit VGen 28 3 0 22 Oct 2021
Grafting Transformer on Automatically Designed Convolutional Neural Network for Hyperspectral Image Classification Xizhe Xue Haokui Zhang Bei Fang Zongwen Bai Ying Li ViT 11 22 0 21 Oct 2021
Vis-TOP: Visual Transformer Overlay Processor Wei Hu Dian Xu Zimeng Fan Fang Liu Yanxiang He BDL ViT 20 5 0 21 Oct 2021
1st Place Solution for the UVO Challenge on Image-based Open-World Segmentation 2021 Yuming Du Wen Guo Yang Xiao Vincent Lepetit 23 10 0 19 Oct 2021
HRFormer: High-Resolution Transformer for Dense Prediction Yuhui Yuan Rao Fu Lang Huang Weihong Lin Chao Zhang Xilin Chen Jingdong Wang ViT 24 226 0 18 Oct 2021
ASFormer: Transformer for Action Segmentation Fangqiu Yi Hongyu Wen Tingting Jiang ViT 73 172 0 16 Oct 2021
COVID-19 Detection in Chest X-ray Images Using Swin-Transformer and Transformer in Transformer Juntao Jiang Shuyi Lin ViT MedIm 11 7 0 16 Oct 2021
Training Neural Networks for Solving 1-D Optimal Piecewise Linear Approximation Hangcheng Dong Jing-Xiao Liao Yan Wang Yixin Chen Bingguo Liu Dong Ye Guodong Liu 54 0 0 14 Oct 2021
Revitalizing CNN Attentions via Transformers in Self-Supervised Visual Representation Learning Chongjian Ge Youwei Liang Yibing Song Jianbo Jiao Jue Wang Ping Luo ViT 18 36 0 11 Oct 2021
Global Vision Transformer Pruning with Hessian-Aware Saliency Huanrui Yang Hongxu Yin Maying Shen Pavlo Molchanov Hai Helen Li Jan Kautz ViT 30 38 0 10 Oct 2021
Google Landmark Retrieval 2021 Competition Third Place Solution Qishen Ha Bo Liu Hongwei Zhang 3DV 3DPC 29 2 0 09 Oct 2021
UniNet: Unified Architecture Search with Convolution, Transformer, and MLP Jihao Liu Hongsheng Li Guanglu Song Xin Huang Yu Liu ViT 37 35 0 08 Oct 2021
ViDT: An Efficient and Effective Fully Transformer-based Object Detector Hwanjun Song Deqing Sun Sanghyuk Chun Varun Jampani Dongyoon Han Byeongho Heo Wonjae Kim Ming-Hsuan Yang 87 76 0 08 Oct 2021
Token Pooling in Vision Transformers D. Marin Jen-Hao Rick Chang Anurag Ranjan Anish K. Prabhu Mohammad Rastegari Oncel Tuzel ViT 70 66 0 08 Oct 2021
Efficient large-scale image retrieval with deep feature orthogonality and Hybrid-Swin-Transformers Christof Henkel 35 14 0 07 Oct 2021
Adversarial Robustness Comparison of Vision Transformer and MLP-Mixer to CNNs Philipp Benz Soomin Ham Chaoning Zhang Adil Karjauv In So Kweon AAML ViT 36 78 0 06 Oct 2021
3rd Place Solution to Google Landmark Recognition Competition 2021 Chengfeng Xu Weimin Wang Shuai Liu Yong Wang Yuxiang Tang Tianling Bian Yanyu Yan Qi She Cheng Yang 3DPC 3DV 25 6 0 06 Oct 2021
Ripple Attention for Visual Perception with Sub-quadratic Complexity Lin Zheng Huijie Pan Lingpeng Kong 23 3 0 06 Oct 2021
MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer Sachin Mehta Mohammad Rastegari ViT 206 1,212 0 05 Oct 2021
GT U-Net: A U-Net Like Group Transformer Network for Tooth Root Segmentation Yunxiang Li Shuai Wang Jun Wang G. Zeng Wenjun Liu Qianni Zhang Qun Jin Yaqi Wang ViT MedIm 23 47 0 30 Sep 2021
CCTrans: Simplifying and Improving Crowd Counting with Transformer Ye Tian Xiangxiang Chu Hongpeng Wang ViT 18 75 0 29 Sep 2021
UFO-ViT: High Performance Linear Vision Transformer without Softmax Jeonggeun Song ViT 111 20 0 29 Sep 2021
BiTr-Unet: a CNN-Transformer Combined Network for MRI Brain Tumor Segmentation Qiran Jia Hai Shu ViT MedIm 90 69 0 25 Sep 2021
End-to-End Dense Video Grounding via Parallel Regression Fengyuan Shi Weilin Huang Limin Wang 37 10 0 23 Sep 2021
UNetFormer: A UNet-like Transformer for Efficient Semantic Segmentation of Remote Sensing Urban Scene Imagery Libo Wang Rui Li Ce Zhang Shenghui Fang Chenxi Duan Xiaoliang Meng P. M. Atkinson ViT 38 623 0 18 Sep 2021
Anchor DETR: Query Design for Transformer-Based Object Detection Yingming Wang X. Zhang Tong Yang Jian-jun Sun ViT 8 53 0 15 Sep 2021
Semi-Supervised Wide-Angle Portraits Correction by Multi-Scale Transformer Fushun Zhu Shan Zhao Peng Wang Hao Wang Hua Yan Shuaicheng Liu ViT 17 16 0 14 Sep 2021
CDTrans: Cross-domain Transformer for Unsupervised Domain Adaptation Tongkun Xu Weihua Chen Pichao Wang Fan Wang Hao Li R. L. Jin ViT 51 215 0 13 Sep 2021