Recent Advances of Local Mechanisms in Computer Vision: A Survey and Outlook of Recent Work

2 June 2023

Papers citing "Recent Advances of Local Mechanisms in Computer Vision: A Survey and Outlook of Recent Work"

27 / 27 papers shown

Title
Masked Image Modeling with Local Multi-Scale Reconstruction Haoqing Wang Yehui Tang Yunhe Wang Jianyuan Guo Zhiwei Deng Kai Han 56 45 0 09 Mar 2023
Video Graph Transformer for Video Question Answering Junbin Xiao Pan Zhou Tat-Seng Chua Shuicheng Yan ViT 131 73 0 12 Jul 2022
Task Discrepancy Maximization for Fine-grained Few-Shot Classification Subeen Lee WonJun Moon Jae-Pil Heo 27 46 0 04 Jul 2022
Self-Supervised Visual Representation Learning with Semantic Grouping Xin Wen Bingchen Zhao Anlin Zheng X. Zhang Xiaojuan Qi SSL 101 71 0 30 May 2022
Mask-guided Vision Transformer (MG-ViT) for Few-Shot Learning Yuzhong Chen Zhe Xiao Lin Zhao Lu Zhang Haixing Dai ... Tuo Zhang Changying Li Dajiang Zhu Tianming Liu Xi Jiang 36 18 0 20 May 2022
Adversarial Masking for Self-Supervised Learning Yuge Shi N. Siddharth Philip H. S. Torr Adam R. Kosiorek SSL 43 81 0 31 Jan 2022
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 258 7,337 0 11 Nov 2021
Unsupervised Part Discovery from Contrastive Reconstruction Subhabrata Choudhury Iro Laina Christian Rupprecht Andrea Vedaldi OCL SSL 157 60 0 11 Nov 2021
A free lunch from ViT:Adaptive Attention Multi-scale Fusion Transformer for Fine-grained Visual Recognition Yuan Zhang Jian Cao Ling Zhang Xiangcheng Liu Zhiyi Wang Feng Ling Weiqian Chen ViT 21 47 0 04 Oct 2021
Rectifying the Shortcut Learning of Background for Few-Shot Learning Xu Luo Longhui Wei Liangjiang Wen Jinrong Yang Lingxi Xie Zenglin Xu Qi Tian 32 71 0 16 Jul 2021
Emerging Properties in Self-Supervised Vision Transformers Mathilde Caron Hugo Touvron Ishan Misra Hervé Jégou Julien Mairal Piotr Bojanowski Armand Joulin 283 5,723 0 29 Apr 2021
VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari Liangzhe Yuan Rui Qian Wei-Hong Chuang Shih-Fu Chang Yin Cui Boqing Gong ViT 231 573 0 22 Apr 2021
Transformer in Transformer Kai Han An Xiao Enhua Wu Jianyuan Guo Chunjing Xu Yunhe Wang ViT 282 1,490 0 27 Feb 2021
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 263 3,538 0 24 Feb 2021
Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals Wouter Van Gansbeke Simon Vandenhende Stamatios Georgoulis Luc Van Gool SSL 183 247 0 11 Feb 2021
TransReID: Transformer-based Object Re-Identification Shuting He Haowen Luo Pichao Wang F. Wang Hao Li Wei Jiang ViT 213 769 0 08 Feb 2021
Transformers in Vision: A Survey Salman Khan Muzammal Naseer Munawar Hayat Syed Waqas Zamir F. Khan M. Shah ViT 222 2,404 0 04 Jan 2021
Identity-Guided Human Semantic Parsing for Person Re-Identification Kuan Zhu Haiyun Guo Zhiwei Liu Ming Tang Jinqiao Wang 183 277 0 27 Jul 2020
CrossTransformers: spatially-aware few-shot transfer Carl Doersch Ankush Gupta Andrew Zisserman ViT 201 276 0 22 Jul 2020
Improved Baselines with Momentum Contrastive Learning Xinlei Chen Haoqi Fan Ross B. Girshick Kaiming He SSL 235 3,029 0 09 Mar 2020
Fine-Grained Visual Classification via Progressive Multi-Granularity Training of Jigsaw Patches Ruoyi Du Dongliang Chang A. Bhunia Jiyang Xie Zhanyu Ma Yi-Zhe Song Jun Guo 69 252 0 08 Mar 2020
Cross Attention Network for Few-shot Classification Rui Hou Hong Chang Bingpeng Ma Shiguang Shan Xilin Chen 202 627 0 17 Oct 2019
Multi-Attention Multi-Class Constraint for Fine-grained Image Recognition Ming-hui Sun Yuchen Yuan Feng Zhou Errui Ding 119 348 0 14 Jun 2018
Learning Deep Representations of Fine-grained Visual Descriptions Scott E. Reed Zeynep Akata Bernt Schiele Honglak Lee OCL VLM 160 804 0 17 May 2016
Spatial Transformer Networks Max Jaderberg Karen Simonyan Andrew Zisserman Koray Kavukcuoglu 124 7,284 0 05 Jun 2015
The Application of Two-level Attention Models in Deep Convolutional Neural Network for Fine-grained Image Classification Tianjun Xiao Yichong Xu Kuiyuan Yang Jiaxing Zhang Yuxin Peng Zheng-Wei Zhang 153 788 0 24 Nov 2014
ImageNet Large Scale Visual Recognition Challenge Olga Russakovsky Jia Deng Hao Su J. Krause S. Satheesh ... A. Karpathy A. Khosla Michael S. Bernstein Alexander C. Berg Li Fei-Fei VLM ObjD 279 39,083 0 01 Sep 2014