Title
UNetFormer: A UNet-like Transformer for Efficient Semantic Segmentation of Remote Sensing Urban Scene Imagery Libo Wang Rui Li Ce Zhang Shenghui Fang Chenxi Duan Xiaoliang Meng P. M. Atkinson ViT 38 624 0 18 Sep 2021
TNS: Terrain Traversability Mapping and Navigation System for Autonomous Excavators Tianrui Guan Zhenpeng He Ruitao Song Dinesh Manocha Liangjun Zhang 21 35 0 13 Sep 2021
LibFewShot: A Comprehensive Library for Few-shot Learning Wenbin Li Ziyi Ziyi Wang Xuesong Yang C. Dong ... Jing Huo Yinghuan Shi Lei Wang Yang Gao Jiebo Luo VLM 110 66 0 10 Sep 2021
UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wise Perspective with Transformer Haonan Wang Peng Cao Jiaqi Wang Osmar R. Zaiane MedIm ViT 126 708 0 09 Sep 2021
nnFormer: Interleaved Transformer for Volumetric Segmentation Hong-Yu Zhou J. Guo Yinghao Zhang Lequan Yu Liansheng Wang Yizhou Yu ViT MedIm 27 306 0 07 Sep 2021
Ultra-high Resolution Image Segmentation via Locality-aware Context Fusion and Alternating Local Enhancement Wenxi Liu Qi Li Xin Lin Weixiang Yang Shengfeng He Yuanlong Yu 29 7 0 06 Sep 2021
Mining Contextual Information Beyond Image for Semantic Segmentation Zhenchao Jin Tao Gong Dongdong Yu Qi Chu Jian Wang Changhu Wang Jie Shao 27 88 0 26 Aug 2021
SwinIR: Image Restoration Using Swin Transformer Jingyun Liang Jie Cao Guolei Sun K. Zhang Luc Van Gool Radu Timofte ViT 42 2,806 0 23 Aug 2021
Trans4Trans: Efficient Transformer for Transparent Object and Semantic Scene Segmentation in Real-World Navigation Assistance Jiaming Zhang Kailun Yang Angela Constantinescu Kunyu Peng Karin Muller Rainer Stiefelhagen ViT 33 69 0 20 Aug 2021
FaPN: Feature-aligned Pyramid Network for Dense Image Prediction Shihua Huang Zhichao Lu Ran Cheng Cheng He 8 202 0 16 Aug 2021
TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation Jinyu Yang Jingjing Liu N. Xu Junzhou Huang 20 125 0 12 Aug 2021
Vision-Language Transformer and Query Generation for Referring Segmentation Henghui Ding Chang-rui Liu Suchen Wang Xudong Jiang 40 251 0 12 Aug 2021
TriTransNet: RGB-D Salient Object Detection with a Triplet Transformer Embedding Network Zhengyi Liu Yuan Wang Zhengzheng Tu Yun Xiao Bin Tang ViT 27 142 0 09 Aug 2021
Unifying Global-Local Representations in Salient Object Detection with Transformer Sucheng Ren Qiang Wen Nanxuan Zhao Guoqiang Han Shengfeng He ViT 26 25 0 05 Aug 2021
Evo-ViT: Slow-Fast Token Evolution for Dynamic Vision Transformer Yifan Xu Zhijie Zhang Mengdan Zhang Kekai Sheng Ke Li Weiming Dong Liqing Zhang Changsheng Xu Xing Sun ViT 29 201 0 03 Aug 2021
DPT: Deformable Patch-based Transformer for Visual Recognition Zhiyang Chen Yousong Zhu Chaoyang Zhao Guosheng Hu Wei Zeng Jinqiao Wang Ming Tang ViT 16 98 0 30 Jul 2021
Rethinking and Improving Relative Position Encoding for Vision Transformer Kan Wu Houwen Peng Minghao Chen Jianlong Fu Hongyang Chao ViT 42 328 0 29 Jul 2021
A Unified Efficient Pyramid Transformer for Semantic Segmentation Fangrui Zhu Yi Zhu Li Zhang Chongruo Wu Yanwei Fu Mu Li ViT 29 29 0 29 Jul 2021
PPT Fusion: Pyramid Patch Transformerfor a Case Study in Image Fusion Yu Fu Tianyang Xu Xiaojun Wu J. Kittler ViT 19 37 0 29 Jul 2021
CycleMLP: A MLP-like Architecture for Dense Prediction Shoufa Chen Enze Xie Chongjian Ge Runjian Chen Ding Liang Ping Luo 19 231 0 21 Jul 2021
RAMS-Trans: Recurrent Attention Multi-scale Transformer forFine-grained Image Recognition Yunqing Hu Xuan Jin Yin Zhang Ha Hong Jingfeng Zhang Yuan He Hui Xue ViT 24 97 0 17 Jul 2021
Trans4Trans: Efficient Transformer for Transparent Object Segmentation to Help Visually Impaired People Navigate in the Real World Jiaming Zhang Kailun Yang Angela Constantinescu Kunyu Peng Karin Muller Rainer Stiefelhagen ViT 36 61 0 07 Jul 2021
Feature Fusion Vision Transformer for Fine-Grained Visual Categorization Jun Wang Xiaohan Yu Yongsheng Gao ViT 35 105 0 06 Jul 2021
Global Filter Networks for Image Classification Yongming Rao Wenliang Zhao Zheng Zhu Jiwen Lu Jie Zhou ViT 16 450 0 01 Jul 2021
Focal Self-attention for Local-Global Interactions in Vision Transformers Jianwei Yang Chunyuan Li Pengchuan Zhang Xiyang Dai Bin Xiao Lu Yuan Jianfeng Gao ViT 42 428 0 01 Jul 2021
MASS: Multi-Attentional Semantic Segmentation of LiDAR Data for Dense Top-View Understanding Kunyu Peng Juncong Fei Kailun Yang Alina Roitberg Jiaming Zhang Frank Bieder Philipp Heidenreich Christoph Stiller Rainer Stiefelhagen 3DPC 17 43 0 01 Jul 2021
Improving the Efficiency of Transformers for Resource-Constrained Devices Hamid Tabani Ajay Balasubramaniam Shabbir Marzban Elahe Arani Bahram Zonooz 33 20 0 30 Jun 2021
K-Net: Towards Unified Image Segmentation Wenwei Zhang Jiangmiao Pang Kai-xiang Chen Chen Change Loy ISeg 32 356 0 28 Jun 2021
Probing Inter-modality: Visual Parsing with Self-Attention for Vision-Language Pre-training Hongwei Xue Yupan Huang Bei Liu Houwen Peng Jianlong Fu Houqiang Li Jiebo Luo 22 88 0 25 Jun 2021
HAN: An Efficient Hierarchical Self-Attention Network for Skeleton-Based Gesture Recognition Jianbo Liu Ying Wang Shiming Xiang Chunhong Pan 30 12 0 25 Jun 2021
IA-RED $^2$ : Interpretability-Aware Redundancy Reduction for Vision Transformers Bowen Pan Rameswar Panda Yifan Jiang Zhangyang Wang Rogerio Feris A. Oliva VLM ViT 39 153 0 23 Jun 2021
Tracking Instances as Queries Shusheng Yang Yuxin Fang Xinggang Wang Yu Li Ying Shan Bin Feng Wenyu Liu 22 10 0 22 Jun 2021
OadTR: Online Action Detection with Transformers Xiang Wang Shiwei Zhang Zhiwu Qing Yuanjie Shao Zhe Zuo Changxin Gao Nong Sang OffRL ViT 32 109 0 21 Jun 2021
Anomaly Detection in Dynamic Graphs via Transformer Yixin Liu Shirui Pan Yu Guang Wang Fei Xiong Liang Wang Qingfeng Chen V. C. Lee 26 91 0 18 Jun 2021
BEiT: BERT Pre-Training of Image Transformers Hangbo Bao Li Dong Songhao Piao Furu Wei ViT 42 2,744 0 15 Jun 2021
Styleformer: Transformer based Generative Adversarial Networks with Style Vector Jeeseung Park Younggeun Kim ViT 23 48 0 13 Jun 2021
CAT: Cross Attention in Vision Transformer Hezheng Lin Xingyi Cheng Xiangyu Wu Fan Yang Dong Shen Zhongyuan Wang Qing Song Wei Yuan ViT 27 149 0 10 Jun 2021
MST: Masked Self-Supervised Transformer for Visual Representation Zhaowen Li Zhiyang Chen Fan Yang Wei Li Yousong Zhu ... Rui Deng Liwei Wu Rui Zhao Ming Tang Jinqiao Wang ViT 30 161 0 10 Jun 2021
Self-supervised Depth Estimation Leveraging Global Perception and Geometric Smoothness Using On-board Videos Shaocheng Jia Xin Pei W. Yao S. Wong 3DPC MDE 35 19 0 07 Jun 2021
ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias Yufei Xu Qiming Zhang Jing Zhang Dacheng Tao ViT 53 329 0 07 Jun 2021
Large-scale Unsupervised Semantic Segmentation Shangqi Gao Zhong-Yu Li Ming-Hsuan Yang Mingg-Ming Cheng Junwei Han Philip H. S. Torr UQCV 38 84 0 06 Jun 2021
Signal Transformer: Complex-valued Attention and Meta-Learning for Signal Recognition Yihong Dong Ying Peng Muqiao Yang Songtao Lu Qingjiang Shi 40 9 0 05 Jun 2021
Robust Mutual Learning for Semi-supervised Semantic Segmentation Pan Zhang Bo Zhang Ting Zhang Dong Chen Fang Wen 17 17 0 01 Jun 2021
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers Enze Xie Wenhai Wang Zhiding Yu Anima Anandkumar J. Álvarez Ping Luo ViT 26 4,827 0 31 May 2021
Analogous to Evolutionary Algorithm: Designing a Unified Sequence Model Jiangning Zhang Chao Xu Jian Li Wenzhou Chen Yabiao Wang Ying Tai Shuo Chen Chengjie Wang Feiyue Huang Yong Liu 29 22 0 31 May 2021
Dual-stream Network for Visual Recognition Mingyuan Mao Renrui Zhang Honghui Zheng Peng Gao Teli Ma Yan Peng Errui Ding Baochang Zhang Shumin Han ViT 20 63 0 31 May 2021
Conformer: Local Features Coupling Global Representations for Visual Recognition Zhiliang Peng Wei Huang Shanzhi Gu Lingxi Xie Yaowei Wang Jianbin Jiao QiXiang Ye ViT 13 527 0 09 May 2021
Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks Meng-Hao Guo Zheng-Ning Liu Tai-Jiang Mu Shimin Hu 20 473 0 05 May 2021
ConTNet: Why not use convolution and transformer at the same time? Haotian Yan Zhe Li Weijian Li Changhu Wang Ming Wu Chuang Zhang ViT 12 76 0 27 Apr 2021
Vision Transformers with Patch Diversification Chengyue Gong Dilin Wang Meng Li Vikas Chandra Qiang Liu ViT 37 62 0 26 Apr 2021