End-to-End Object Detection with Adaptive Clustering Transformer

18 November 2020

Minghang Zheng

Papers citing "End-to-End Object Detection with Adaptive Clustering Transformer"

50 / 103 papers shown

Title
Self-Supervised Masked Convolutional Transformer Block for Anomaly Detection Neelu Madan Nicolae-Cătălin Ristea Radu Tudor Ionescu Kamal Nasrollahi F. Khan T. Moeslund M. Shah ViT MedIm 258 61 0 25 Sep 2022
Multi-scale Feature Aggregation for Crowd Counting Xiaoheng Jiang Xinyi Wu Hisham Cholakkal Rao Muhammad Anwer Jiale Xu Bing Zhou Yanwei Pang F. Khan 8 1 0 10 Aug 2022
Convolutional Embedding Makes Hierarchical Vision Transformer Stronger Cong Wang Hongmin Xu Xiong Zhang Li Wang Zhitong Zheng Haifeng Liu ViT 20 20 0 27 Jul 2022
Tip-Adapter: Training-free Adaption of CLIP for Few-shot Classification Renrui Zhang Zhang Wei Rongyao Fang Peng Gao Kunchang Li Jifeng Dai Yu Qiao Hongsheng Li VLM 26 292 0 19 Jul 2022
Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives Jun Li Junyu Chen Yucheng Tang Ce Wang Bennett A. Landman S. K. Zhou ViT OOD MedIm 21 21 0 02 Jun 2022
Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud Pre-training Renrui Zhang Ziyu Guo Rongyao Fang Bingyan Zhao Dong Wang Yu Qiao Hongsheng Li Peng Gao 3DPC 178 244 0 28 May 2022
HCFRec: Hash Collaborative Filtering via Normalized Flow with Structural Consensus for Efficient Recommendation Fan Wang Weiming Liu Chaochao Chen Mengying Zhu Xiaolin Zheng 23 2 0 24 May 2022
Understanding The Robustness in Vision Transformers Daquan Zhou Zhiding Yu Enze Xie Chaowei Xiao Anima Anandkumar Jiashi Feng J. Álvarez ViT 22 185 0 26 Apr 2022
Multimodal Multi-Head Convolutional Attention with Various Kernel Sizes for Medical Image Super-Resolution Mariana-Iuliana Georgescu Radu Tudor Ionescu A. Miron O. Savencu Nicolae-Cătălin Ristea N. Verga F. Khan SupR 18 46 0 08 Apr 2022
BigDetection: A Large-scale Benchmark for Improved Object Detector Pre-training Likun Cai Zhi-Li Zhang Yi Zhu Li Zhang Mu Li Xiangyang Xue VLM ObjD 40 40 0 24 Mar 2022
Transformers Meet Visual Learning Understanding: A Comprehensive Review Yuting Yang Licheng Jiao Xuantong Liu F. Liu Shuyuan Yang Zhixi Feng Xu Tang ViT MedIm 27 28 0 24 Mar 2022
MonoDETR: Depth-guided Transformer for Monocular 3D Object Detection Renrui Zhang Han Qiu Tai Wang Ziyu Guo Xuan Xu Xuanzhuo Xu Ziteng Cui Peng Gao Hongsheng Li Hongsheng Li ViT MDE 56 82 0 24 Mar 2022
Focal Modulation Networks Jianwei Yang Chunyuan Li Xiyang Dai Lu Yuan Jianfeng Gao 3DPC 33 263 0 22 Mar 2022
SepTr: Separable Transformer for Audio Spectrogram Processing Nicolae-Cătălin Ristea Radu Tudor Ionescu F. Khan ViT 18 30 0 17 Mar 2022
Unified Visual Transformer Compression Shixing Yu Tianlong Chen Jiayi Shen Huan Yuan Jianchao Tan Sen Yang Ji Liu Zhangyang Wang ViT 19 92 0 15 Mar 2022
Progressive End-to-End Object Detection in Crowded Scenes Anlin Zheng Yuang Zhang Xinming Zhang Xiao Qi Jian Sun ObjD 19 60 0 15 Mar 2022
The Principle of Diversity: Training Stronger Vision Transformers Calls for Reducing All Levels of Redundancy Tianlong Chen Zhenyu (Allen) Zhang Yu Cheng Ahmed Hassan Awadallah Zhangyang Wang ViT 41 37 0 12 Mar 2022
Anti-Oversmoothing in Deep Vision Transformers via the Fourier Domain Analysis: From Theory to Practice Peihao Wang Wenqing Zheng Tianlong Chen Zhangyang Wang ViT 24 127 0 09 Mar 2022
Boosting Crowd Counting via Multifaceted Attention Hui Lin Zhiheng Ma Rongrong Ji Yaowei Wang Xiaopeng Hong 23 145 0 05 Mar 2022
D^2ETR: Decoder-Only DETR with Computationally Efficient Cross-Scale Attention Junyu Lin Xiaofeng Mao YueFeng Chen Lei Xu Yuan He Hui Xue MU ViT 14 22 0 02 Mar 2022
Auto-scaling Vision Transformers without Training Wuyang Chen Wei Huang Xianzhi Du Xiaodan Song Zhangyang Wang Denny Zhou ViT 32 23 0 24 Feb 2022
Dynamic Label Assignment for Object Detection by Combining Predicted IoUs and Anchor IoUs Tianxiao Zhang Bo Luo A. Sharda Guanghui Wang 39 18 0 23 Jan 2022
TransFuse: A Unified Transformer-based Image Fusion Framework using Self-supervised Learning Linhao Qu Shaolei Liu Manning Wang Shiman Li Siqi Yin Qin Qiao Zhijian Song ViT SSL 11 22 0 19 Jan 2022
Spatio-Temporal Tuples Transformer for Skeleton-Based Action Recognition Helei Qiu B. Hou Bo Ren Xiaohua Zhang ViT 19 47 0 08 Jan 2022
Image-to-Image Translation-based Data Augmentation for Robust EV Charging Inlet Detection Yeonjun Bang Yeejin Lee Byeongkeun Kang ViT 8 12 0 10 Dec 2021
PointCLIP: Point Cloud Understanding by CLIP Renrui Zhang Ziyu Guo Wei Zhang Kunchang Li Xupeng Miao Bin Cui Yu Qiao Peng Gao Hongsheng Li VLM 3DPC 175 435 0 04 Dec 2021
A Survey of Visual Transformers Yang Liu Yao Zhang Yixin Wang Feng Hou Jin Yuan Jiang Tian Yang Zhang Zhongchao Shi Jianping Fan Zhiqiang He 3DGS ViT 77 330 0 11 Nov 2021
Sampling Equivariant Self-attention Networks for Object Detection in Aerial Images Guo-Ye Yang Xiang-Li Li Ralph Robert Martin Shimin Hu 3DPC 21 13 0 05 Nov 2021
CvT-ASSD: Convolutional vision-Transformer Based Attentive Single Shot MultiBox Detector Weiqiang Jin Hang Yu Xiangfeng Luo ViT 16 14 0 24 Oct 2021
PnP-DETR: Towards Efficient Visual Analysis with Transformers Tao Wang Li Yuan Yunpeng Chen Jiashi Feng Shuicheng Yan ViT 24 82 0 15 Sep 2021
FuseFormer: Fusing Fine-Grained Information in Transformers for Video Inpainting R. Liu Hanming Deng Yangyi Huang Xiaoyu Shi Lewei Lu Wenxiu Sun Xiaogang Wang Jifeng Dai Hongsheng Li ViT 24 124 0 07 Sep 2021
Guiding Query Position and Performing Similar Attention for Transformer-Based Detection Heads Xiaohu Jiang Ze Chen Zhicheng Wang Erjin Zhou Chun Yuan 12 2 0 22 Aug 2021
Light Field Image Super-Resolution with Transformers Zhengyu Liang Yingqian Wang Longguang Wang Jungang Yang Shilin Zhou ViT 22 115 0 17 Aug 2021
Conditional DETR for Fast Training Convergence Depu Meng Xiaokang Chen Zejia Fan Gang Zeng Houqiang Li Yuhui Yuan Lei-huan Sun Jingdong Wang ViT 29 597 0 13 Aug 2021
Fast Convergence of DETR with Spatially Modulated Co-Attention Peng Gao Minghang Zheng Xiaogang Wang Jifeng Dai Hongsheng Li ViT 19 305 0 05 Aug 2021
Vision Transformer with Progressive Sampling Xiaoyu Yue Shuyang Sun Zhanghui Kuang Meng Wei Philip H. S. Torr Wayne Zhang Dahua Lin ViT 16 81 0 03 Aug 2021
Focal Self-attention for Local-Global Interactions in Vision Transformers Jianwei Yang Chunyuan Li Pengchuan Zhang Xiyang Dai Bin Xiao Lu Yuan Jianfeng Gao ViT 42 428 0 01 Jul 2021
OadTR: Online Action Detection with Transformers Xiang Wang Shiwei Zhang Zhiwu Qing Yuanjie Shao Zhe Zuo Changxin Gao Nong Sang OffRL ViT 34 109 0 21 Jun 2021
Efficient Self-supervised Vision Transformers for Representation Learning Chunyuan Li Jianwei Yang Pengchuan Zhang Mei Gao Bin Xiao Xiyang Dai Lu Yuan Jianfeng Gao ViT 37 209 0 17 Jun 2021
A Survey of Transformers Tianyang Lin Yuxin Wang Xiangyang Liu Xipeng Qiu ViT 41 1,088 0 08 Jun 2021
Chasing Sparsity in Vision Transformers: An End-to-End Exploration Tianlong Chen Yu Cheng Zhe Gan Lu Yuan Lei Zhang Zhangyang Wang ViT 13 216 0 08 Jun 2021
Refiner: Refining Self-attention for Vision Transformers Daquan Zhou Yujun Shi Bingyi Kang Weihao Yu Zihang Jiang Yuan Li Xiaojie Jin Qibin Hou Jiashi Feng ViT 29 59 0 07 Jun 2021
Oriented Object Detection with Transformer Teli Ma Mingyuan Mao Honghui Zheng Peng Gao Xiaodi Wang Shumin Han Errui Ding Baochang Zhang David Doermann ViT 19 40 0 06 Jun 2021
Container: Context Aggregation Network Peng Gao Jiasen Lu Hongsheng Li Roozbeh Mottaghi Aniruddha Kembhavi ViT 17 69 0 02 Jun 2021
Probabilistic Ranking-Aware Ensembles for Enhanced Object Detections Mingyuan Mao Baochang Zhang David Doermann Jie Guo Shumin Han Yuan Feng Xiaodi Wang Errui Ding 11 2 0 07 May 2021
Instances as Queries Yuxin Fang Shusheng Yang Xinggang Wang Yu Li Chen Fang Ying Shan Bin Feng Wenyu Liu ISeg 42 255 0 05 May 2021
All Tokens Matter: Token Labeling for Training Better Vision Transformers Zihang Jiang Qibin Hou Li-xin Yuan Daquan Zhou Yujun Shi Xiaojie Jin Anran Wang Jiashi Feng ViT 19 203 0 22 Apr 2021
CvT: Introducing Convolutions to Vision Transformers Haiping Wu Bin Xiao Noel Codella Mengchen Liu Xiyang Dai Lu Yuan Lei Zhang ViT 42 1,876 0 29 Mar 2021
Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding Pengchuan Zhang Xiyang Dai Jianwei Yang Bin Xiao Lu Yuan Lei Zhang Jianfeng Gao ViT 29 329 0 29 Mar 2021
Tokens-to-Token ViT: Training Vision Transformers from Scratch on ImageNet Li-xin Yuan Yunpeng Chen Tao Wang Weihao Yu Yujun Shi Zihang Jiang Francis E. H. Tay Jiashi Feng Shuicheng Yan ViT 28 1,904 0 28 Jan 2021