Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

25 March 2021

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

32 / 2,432 papers shown

Title
FineAction: A Fine-Grained Video Dataset for Temporal Action Localization Yi Liu Limin Wang Yali Wang Xiao Ma Yu Qiao 17 56 0 24 May 2021
Intriguing Properties of Vision Transformers Muzammal Naseer Kanchana Ranasinghe Salman Khan Munawar Hayat F. Khan Ming-Hsuan Yang ViT 253 620 0 21 May 2021
Pay Attention to MLPs Hanxiao Liu Zihang Dai David R. So Quoc V. Le AI4CE 37 651 0 17 May 2021
You Only Learn One Representation: Unified Network for Multiple Tasks Chien-Yao Wang I-Hau Yeh Hongpeng Liao SSL FedML 18 478 0 10 May 2021
MOTR: End-to-End Multiple-Object Tracking with Transformer Fangao Zeng Bin Dong Cheng Chen Tiancai Wang X. Zhang Yichen Wei VOT 17 498 0 07 May 2021
A State-of-the-art Survey of Object Detection Techniques in Microorganism Image Analysis: From Classical Methods to Deep Learning Approaches Pingli Ma Chen Li M. Rahaman Yudong Yao Jiawei Zhang Shuojia Zou Xin Zhao M. Grzegorzek 24 62 0 07 May 2021
Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks Meng-Hao Guo Zheng-Ning Liu Tai-Jiang Mu Shimin Hu 20 473 0 05 May 2021
Attention for Image Registration (AiR): an unsupervised Transformer approach Zihao W. Wang H. Delingette ViT MedIm 25 7 0 05 May 2021
Instances as Queries Yuxin Fang Shusheng Yang Xinggang Wang Yu Li Chen Fang Ying Shan Bin Feng Wenyu Liu ISeg 42 255 0 05 May 2021
TransHash: Transformer-based Hamming Hashing for Efficient Image Retrieval Yongbiao Chen Shenmin Zhang Fangxin Liu Zhigang Chang Mang Ye Zhengwei Qi Shanghai Jiao Tong University ViT 27 48 0 05 May 2021
MLP-Mixer: An all-MLP Architecture for Vision Ilya O. Tolstikhin N. Houlsby Alexander Kolesnikov Lucas Beyer Xiaohua Zhai ... Andreas Steiner Daniel Keysers Jakob Uszkoreit Mario Lucic Alexey Dosovitskiy 265 2,603 0 04 May 2021
AGMB-Transformer: Anatomy-Guided Multi-Branch Transformer Network for Automated Evaluation of Root Canal Therapy Yunxiang Li G. Zeng Yifan Zhang Jun Wang Qianni Zhang ... Neng Xia Ruizi Peng Kai Tang Yaqi Wang Shuai Wang MedIm AI4CE 92 28 0 02 May 2021
Vision Transformers with Patch Diversification Chengyue Gong Dilin Wang Meng Li Vikas Chandra Qiang Liu ViT 37 62 0 26 Apr 2021
Visformer: The Vision-friendly Transformer Zhengsu Chen Lingxi Xie Jianwei Niu Xuefeng Liu Longhui Wei Qi Tian ViT 109 209 0 26 Apr 2021
A Survey of Modern Deep Learning based Object Detection Models Syed Sahil Abbas Zaidi M. S. Ansari Asra Aslam N. Kanwal M. Asghar Brian Lee VLM ObjD 61 728 0 24 Apr 2021
Multiscale Vision Transformers Haoqi Fan Bo Xiong K. Mangalam Yanghao Li Zhicheng Yan Jitendra Malik Christoph Feichtenhofer ViT 19 1,221 0 22 Apr 2021
All Tokens Matter: Token Labeling for Training Better Vision Transformers Zihang Jiang Qibin Hou Li-xin Yuan Daquan Zhou Yujun Shi Xiaojie Jin Anran Wang Jiashi Feng ViT 12 203 0 22 Apr 2021
Bridging Global Context Interactions for High-Fidelity Image Completion Chuanxia Zheng Tat-Jen Cham Jianfei Cai Dinh Q. Phung ViT 35 78 0 02 Apr 2021
On the Adversarial Robustness of Vision Transformers Rulin Shao Zhouxing Shi Jinfeng Yi Pin-Yu Chen Cho-Jui Hsieh ViT 25 137 0 29 Mar 2021
Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding Pengchuan Zhang Xiyang Dai Jianwei Yang Bin Xiao Lu Yuan Lei Zhang Jianfeng Gao ViT 23 328 0 29 Mar 2021
UNETR: Transformers for 3D Medical Image Segmentation Ali Hatamizadeh Yucheng Tang Vishwesh Nath Dong Yang Andriy Myronenko Bennett Landman H. Roth Daguang Xu ViT MedIm 45 1,533 0 18 Mar 2021
Transformer in Transformer Kai Han An Xiao Enhua Wu Jianyuan Guo Chunjing Xu Yunhe Wang ViT 284 1,524 0 27 Feb 2021
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 274 3,622 0 24 Feb 2021
Deep Texture-Aware Features for Camouflaged Object Detection Jingjing Ren Xiaowei Hu Lei Zhu Xuemiao Xu Yangyang Xu Weiming Wang Zijun Deng Pheng-Ann Heng ObjD 91 109 0 05 Feb 2021
Active Boundary Loss for Semantic Segmentation Chi-Yin Wang Yunke Zhang Miaomiao Cui Peiran Ren Yin Yang Xuansong Xie Xiansheng Hua Hujun Bao Weiwei Xu 44 63 0 04 Feb 2021
Bottleneck Transformers for Visual Recognition A. Srinivas Tsung-Yi Lin Niki Parmar Jonathon Shlens Pieter Abbeel Ashish Vaswani SLR 275 979 0 27 Jan 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir F. Khan M. Shah ViT 227 2,428 0 04 Jan 2021
Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation Golnaz Ghiasi Yin Cui A. Srinivas Rui Qian Tsung-Yi Lin E. D. Cubuk Quoc V. Le Barret Zoph ISeg 226 968 0 13 Dec 2020
Efficient Transformers: A Survey Yi Tay Mostafa Dehghani Dara Bahri Donald Metzler VLM 74 1,101 0 14 Sep 2020
Harmonic Convolutional Networks based on Discrete Cosine Transform Matej Ulicny V. Krylov Rozenn Dahyot 25 34 0 18 Jan 2020
LIP: Local Importance-based Pooling Ziteng Gao Limin Wang Gangshan Wu FAtt 29 94 0 12 Aug 2019
Semantic Understanding of Scenes through the ADE20K Dataset Bolei Zhou Hang Zhao Xavier Puig Tete Xiao Sanja Fidler Adela Barriuso Antonio Torralba SSeg 253 1,827 0 18 Aug 2016