Segmenter: Transformer for Semantic Segmentation

12 May 2021

Papers citing "Segmenter: Transformer for Semantic Segmentation"

24 / 174 papers shown

Title
VLP: A Survey on Vision-Language Pre-training Feilong Chen Duzhen Zhang Minglun Han Xiuyi Chen Jing Shi Shuang Xu Bo Xu VLM 82 211 0 18 Feb 2022
Revisiting Over-smoothing in BERT from the Perspective of Graph Han Shi Jiahui Gao Hang Xu Xiaodan Liang Zhenguo Li Lingpeng Kong Stephen M. S. Lee James T. Kwok 19 71 0 17 Feb 2022
SeMask: Semantically Masked Transformers for Semantic Segmentation Jitesh Jain Anukriti Singh Nikita Orlov Zilong Huang Jiachen Li Steven Walton Humphrey Shi ViT 24 92 0 23 Dec 2021
Masked-attention Mask Transformer for Universal Image Segmentation Bowen Cheng Ishan Misra A. Schwing Alexander Kirillov Rohit Girdhar ISeg 40 2,256 0 02 Dec 2021
MViTv2: Improved Multiscale Vision Transformers for Classification and Detection Yanghao Li Chaoxia Wu Haoqi Fan K. Mangalam Bo Xiong Jitendra Malik Christoph Feichtenhofer ViT 46 676 0 02 Dec 2021
TransFGU: A Top-down Approach to Fine-Grained Unsupervised Semantic Segmentation Zhao-Heng Yin Pichao Wang Fan Wang Xianzhe Xu Hanling Zhang Hao Li Rong Jin 27 39 0 02 Dec 2021
Building extraction with vision transformer Libo Wang Shenghui Fang Rui Li Xiaoliang Meng ViT 20 158 0 29 Nov 2021
A Survey of Visual Transformers Yang Liu Yao Zhang Yixin Wang Feng Hou Jin Yuan Jiang Tian Yang Zhang Zhongchao Shi Jianping Fan Zhiqiang He 3DGS ViT 66 330 0 11 Nov 2021
MFNet: Multi-class Few-shot Segmentation Network with Pixel-wise Metric Learning Miao Zhang Miaojing Shi Li Li VLM 25 20 0 30 Oct 2021
Pathologies in priors and inference for Bayesian transformers Tristan Cinquin Alexander Immer Max Horn Vincent Fortuin UQCV BDL MedIm 29 9 0 08 Oct 2021
Ripple Attention for Visual Perception with Sub-quadratic Complexity Lin Zheng Huijie Pan Lingpeng Kong 19 3 0 06 Oct 2021
UNetFormer: A UNet-like Transformer for Efficient Semantic Segmentation of Remote Sensing Urban Scene Imagery Libo Wang Rui Li Ce Zhang Shenghui Fang Chenxi Duan Xiaoliang Meng P. M. Atkinson ViT 38 623 0 18 Sep 2021
Trans4Trans: Efficient Transformer for Transparent Object and Semantic Scene Segmentation in Real-World Navigation Assistance Jiaming Zhang Kailun Yang Angela Constantinescu Kunyu Peng Karin Muller Rainer Stiefelhagen ViT 28 69 0 20 Aug 2021
PPT Fusion: Pyramid Patch Transformerfor a Case Study in Image Fusion Yu Fu Tianyang Xu Xiaojun Wu J. Kittler ViT 17 37 0 29 Jul 2021
Trans4Trans: Efficient Transformer for Transparent Object Segmentation to Help Visually Impaired People Navigate in the Real World Jiaming Zhang Kailun Yang Angela Constantinescu Kunyu Peng Karin Muller Rainer Stiefelhagen ViT 23 61 0 07 Jul 2021
Focal Self-attention for Local-Global Interactions in Vision Transformers Jianwei Yang Chunyuan Li Pengchuan Zhang Xiyang Dai Bin Xiao Lu Yuan Jianfeng Gao ViT 22 425 0 01 Jul 2021
How to train your ViT? Data, Augmentation, and Regularization in Vision Transformers Andreas Steiner Alexander Kolesnikov Xiaohua Zhai Ross Wightman Jakob Uszkoreit Lucas Beyer ViT 29 610 0 18 Jun 2021
GANav: Efficient Terrain Segmentation for Robot Navigation in Unstructured Outdoor Environments Tianrui Guan D. Kothandaraman Rohan Chandra A. Sathyamoorthy K. Weerakoon Dinesh Manocha 20 103 0 07 Mar 2021
Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius Heng Wang Lorenzo Torresani ViT 278 1,978 0 09 Feb 2021
CrossTransformers: spatially-aware few-shot transfer Carl Doersch Ankush Gupta Andrew Zisserman ViT 201 328 0 22 Jul 2020
Bag of Tricks for Image Classification with Convolutional Neural Networks Tong He Zhi-Li Zhang Hang Zhang Zhongyue Zhang Junyuan Xie Mu Li 216 1,398 0 04 Dec 2018
Deep Semantic Segmentation for Automated Driving: Taxonomy, Roadmap and Challenges Mennatullah Siam Sara Elkerdawy Martin Jägersand S. Yogamani 109 166 0 08 Jul 2017
Semantic Understanding of Scenes through the ADE20K Dataset Bolei Zhou Hang Zhao Xavier Puig Tete Xiao Sanja Fidler Adela Barriuso Antonio Torralba SSeg 249 1,821 0 18 Aug 2016
SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation Vijay Badrinarayanan Alex Kendall R. Cipolla SSeg 432 15,595 0 02 Nov 2015