Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

25 March 2021

Papers citing "Swin Transformer: Hierarchical Vision Transformer using Shifted Windows"

50 / 2,465 papers shown

Title
EGIC: Enhanced Low-Bit-Rate Generative Image Compression Guided by Semantic Segmentation Nikolai Korber Eduard Kromer Andreas Siebert S. Hauke Daniel Mueller-Gritschneder Björn Schuller DiffM VLM 18 4 0 06 Sep 2023
PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic Occupancy Prediction Si Zuo Wenzhao Zheng Yuan-Ko Huang Jie Zhou Jiwen Lu 3DPC 33 37 0 31 Aug 2023
SportsSloMo: A New Benchmark and Baselines for Human-centric Video Frame Interpolation Jiaben Chen Huaizu Jiang 3DH 33 6 0 31 Aug 2023
Towards Optimal Patch Size in Vision Transformers for Tumor Segmentation Ramtin Mojtahedi M. Hamghalam Richard K G Do Amber L. Simpson ViT MedIm 20 7 0 31 Aug 2023
PivotNet: Vectorized Pivot Learning for End-to-end HD Map Construction Wenjie Ding Limeng Qiao Xi Qiu Chi Zhang 3DPC 34 67 0 31 Aug 2023
Deformation Robust Text Spotting with Geometric Prior Xixuan Hao Aozhong Zhang Xianze Meng Bin Fu 24 0 0 31 Aug 2023
Complementing Onboard Sensors with Satellite Map: A New Perspective for HD Map Construction Wenjie Gao Jiawei Fu Yanqing Shen Haodong Jing Shitao Chen Nanning Zheng 33 15 0 29 Aug 2023
Efficient Model Personalization in Federated Learning via Client-Specific Prompt Generation Fu-En Yang Chien-Yi Wang Yu-Chiang Frank Wang VLM FedML 21 59 0 29 Aug 2023
NOVIS: A Case for End-to-End Near-Online Video Instance Segmentation Tim Meinhardt Matt Feiszli Yuchen Fan Laura Leal-Taixe Rakesh Ranjan ViT 19 5 0 29 Aug 2023
Uncovering the Hidden Cost of Model Compression Diganta Misra Muawiz Chaudhary Agam Goyal Bharat Runwal Pin-Yu Chen VLM 33 0 0 29 Aug 2023
PanoSwin: a Pano-style Swin Transformer for Panorama Understanding Zhixin Ling Zhen Xing Xiangdong Zhou Manliang Cao G. Zhou ViT 26 17 0 28 Aug 2023
AI-Generated Content (AIGC) for Various Data Modalities: A Survey Lin Geng Foo Hossein Rahmani J. Liu 73 31 0 27 Aug 2023
Learning Heavily-Degraded Prior for Underwater Object Detection C. Fu Xin-Yue Fan Jiewen Xiao Wanqi Yuan Risheng Liu Zhongxuan Luo 21 22 0 24 Aug 2023
DISCO: Distribution-Aware Calibration for Object Detection with Noisy Bounding Boxes Donghao Zhou Jialin Li Jinpeng Li Jiancheng Huang Qiang Nie Y. Liu Bin-Bin Gao Qiong Wang Pheng-Ann Heng Guangyong Chen 30 3 0 23 Aug 2023
CoC-GAN: Employing Context Cluster for Unveiling a New Pathway in Image Generation Zihao Wang Yiming Huang Ziyu Zhou 23 0 0 23 Aug 2023
SwinFace: A Multi-task Transformer for Face Recognition, Expression Recognition, Age Estimation and Attribute Estimation Lixiong Qin Mei Wang Chao Deng K. Wang Xiangshan Chen Jiani Hu Weihong Deng CVBM ViT 29 38 0 22 Aug 2023
TurboViT: Generating Fast Vision Transformers via Generative Architecture Search Alexander Wong Saad Abbasi Saeejith Nair ViT 27 1 0 22 Aug 2023
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers N. Frumkin Dibakar Gope Diana Marculescu MQ 33 16 0 21 Aug 2023
MGMAE: Motion Guided Masking for Video Masked Autoencoding Bingkun Huang Zhiyu Zhao Guozhen Zhang Yu Qiao Limin Wang 28 30 0 21 Aug 2023
Enhancing Adversarial Attacks: The Similar Target Method Shuo Zhang Ziruo Wang Zikai Zhou Huanran Chen AAML 48 1 0 21 Aug 2023
Exploring Fine-Grained Representation and Recomposition for Cloth-Changing Person Re-Identification Qizao Wang Xuelin Qian Bin Li Xiangyang Xue Yanwei Fu 32 8 0 21 Aug 2023
In-Rack Test Tube Pose Estimation Using RGB-D Data Hao Chen Weiwei Wan Masaki Matsushita Takeyuki Kotaka Kensuke Harada 24 1 0 21 Aug 2023
Robust Mixture-of-Expert Training for Convolutional Neural Networks Yihua Zhang Ruisi Cai Tianlong Chen Guanhua Zhang Huan Zhang Pin-Yu Chen Shiyu Chang Zhangyang Wang Sijia Liu MoE AAML OOD 34 16 0 19 Aug 2023
Which Transformer to Favor: A Comparative Analysis of Efficiency in Vision Transformers Tobias Christian Nauen Sebastián M. Palacio Federico Raue Andreas Dengel 42 3 0 18 Aug 2023
Language-Guided Diffusion Model for Visual Grounding Sijia Chen Baochun Li 27 5 0 18 Aug 2023
MeViS: A Large-scale Benchmark for Video Segmentation with Motion Expressions Henghui Ding Chang Liu Shuting He Xudong Jiang Chen Change Loy VOS 44 101 0 16 Aug 2023
S2R: Exploring a Double-Win Transformer-Based Framework for Ideal and Blind Super-Resolution Minghao She Wendong Mao Huihong Shi Zhongfeng Wang ViT 9 0 0 16 Aug 2023
UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation Haiyang Wang Hao Tang Shaoshuai Shi Aoxue Li Zhenguo Li Bernt Schiele Liwei Wang ViT 32 56 0 15 Aug 2023
Real-time Automatic M-mode Echocardiography Measurement with Panel Attention from Local-to-Global Pixels Ching-Hsun Tseng S. Chien Po-Shen Wang Shin-Jye Lee Wei-Huan Hu Bin Pu Xiaojun Zeng 19 1 0 15 Aug 2023
SST: A Simplified Swin Transformer-based Model for Taxi Destination Prediction based on Existing Trajectory Zepu Wang Yifei Sun Zhiyu Lei Xin-Di Zhu Peng Sun 19 4 0 15 Aug 2023
A Unified Query-based Paradigm for Camouflaged Instance Segmentation Do Dong Jialun Pei Rongrong Gao Tian-Zhu Xiang Shuo Wang Huan Xiong ISeg 26 12 0 14 Aug 2023
Large-kernel Attention for Efficient and Robust Brain Lesion Segmentation Liam Chalcroft Ruben Lourencco Pereira Mikael Brudfors Andrew S. Kayser M. D’Esposito Cathy J. Price Ioannis Pappas John Ashburner ViT 3DV MedIm 19 8 0 14 Aug 2023
AudioFormer: Audio Transformer learns audio feature representations from discrete acoustic codes Zhaohui Li Haitao Wang Xinghua Jiang 40 1 0 14 Aug 2023
FocusFlow: Boosting Key-Points Optical Flow Estimation for Autonomous Driving Zhonghua Yi Haowen Shi Kailun Yang Qi Jiang Yaozu Ye Ze Wang Huajian Ni Kaiwei Wang 3DPC 20 9 0 14 Aug 2023
Multi-Label Knowledge Distillation Penghui Yang Ming-Kun Xie Chen-Chen Zong Lei Feng Gang Niu Masashi Sugiyama Sheng-Jun Huang 33 10 0 12 Aug 2023
Semantic-embedded Similarity Prototype for Scene Recognition Chuanxin Song Hanbo Wu X. Ma Yibin Li 24 3 0 11 Aug 2023
SegDA: Maximum Separable Segment Mask with Pseudo Labels for Domain Adaptive Semantic Segmentation Anant Khandelwal 24 1 0 10 Aug 2023
A Brief Yet In-Depth Survey of Deep Learning-Based Image Watermarking Xin Zhong A. Das Fahad Alrasheedi A. Tanvir 22 2 0 08 Aug 2023
SSTFormer: Bridging Spiking Neural Network and Memory Support Transformer for Frame-Event based Recognition Xiao Wang Zong-Yao Wu Yao Rong Lin Zhu Bowei Jiang Jin Tang Yonghong Tian ViT 71 15 0 08 Aug 2023
Improving FHB Screening in Wheat Breeding Using an Efficient Transformer Model Babak Azad A. Abdalla Kwanghee Won A. M. Nafchi MedIm 21 2 0 07 Aug 2023
Dual Aggregation Transformer for Image Super-Resolution Zheng Chen Yulun Zhang Jinjin Gu L. Kong Xiaokang Yang F. I. F. Richard Yu ViT 11 167 0 07 Aug 2023
Strategic Preys Make Acute Predators: Enhancing Camouflaged Object Detectors by Generating Camouflaged Objects Chunming He Kai Li Yachao Zhang Yulun Zhang Z. Guo Xiu Li Martin Danelljan F. I. F. Richard Yu AAML 30 44 0 06 Aug 2023
TOPIQ: A Top-down Approach from Semantics to Distortions for Image Quality Assessment Chaofeng Chen Jiadi Mo Jingwen Hou Haoning Wu Liang Liao Wenxiu Sun Qiong Yan Weisi Lin 43 112 0 06 Aug 2023
High-Resolution Vision Transformers for Pixel-Level Identification of Structural Components and Damage Kareem A. Eltouny S. Sajedi Xiao Liang ViT 14 5 0 06 Aug 2023
Frequency Disentangled Features in Neural Image Compression Ali Zafari Atefeh Khoshkhahtinat P. Mehta Mohammad Saeed Ebrahimi Saadabadi Mohammad Akyash Nasser M. Nasrabadi 42 14 0 04 Aug 2023
M2Former: Multi-Scale Patch Selection for Fine-Grained Visual Recognition Ji-Hee Moon Junseok K. Lee Yu-Ling Lee Seongsik Park 24 4 0 04 Aug 2023
DETR Doesn't Need Multi-Scale or Locality Design Yutong Lin Yuhui Yuan Zheng-Wei Zhang Chen Li Nanning Zheng Han Hu 30 5 0 03 Aug 2023
An End-to-end Food Portion Estimation Framework Based on Shape Reconstruction from Monocular Image Zeman Shao Gautham Vinod Jiangpeng He F. Zhu 25 13 0 03 Aug 2023
IndoHerb: Indonesia Medicinal Plants Recognition using Transfer Learning and Deep Learning Muhammad Salman Ikrar Musyaffa N. Yudistira Muhammad Arif Rahman Jati Batoro 12 2 0 03 Aug 2023
Get the Best of Both Worlds: Improving Accuracy and Transferability by Grassmann Class Representation Haoqi Wang Zhizhong Li Wayne Zhang 15 2 0 03 Aug 2023