Local Relation Networks for Image Recognition

25 April 2019

Papers citing "Local Relation Networks for Image Recognition"

50 / 88 papers shown

Title
DFEN: Dual Feature Equalization Network for Medical Image Segmentation Jianjian Yin Yi Chen C. Li Zhichao Zheng Yanhui Gu Junsheng Zhou MedIm 29 0 0 09 May 2025
Integrating Human Vision Perception in Vision Transformers for Classifying Waste Items Akshat Shrivastava Tapan K. Gandhi 21 1 0 19 Dec 2023
PanoSwin: a Pano-style Swin Transformer for Panorama Understanding Zhixin Ling Zhen Xing Xiangdong Zhou Manliang Cao G. Zhou ViT 26 17 0 28 Aug 2023
Real-time Automatic M-mode Echocardiography Measurement with Panel Attention from Local-to-Global Pixels Ching-Hsun Tseng S. Chien Po-Shen Wang Shin-Jye Lee Wei-Huan Hu Bin Pu Xiaojun Zeng 19 1 0 15 Aug 2023
DETR Doesn't Need Multi-Scale or Locality Design Yutong Lin Yuhui Yuan Zheng-Wei Zhang Chen Li Nanning Zheng Han Hu 30 5 0 03 Aug 2023
Digital Modeling on Large Kernel Metamaterial Neural Network Quan Liu Hanyu Zheng Brandon T. Swartz Ho Hin Lee Zuhayr Asad I. Kravchenko Jason G Valentine Yuankai Huo 8 4 0 21 Jul 2023
Early Detection of Alzheimer's Disease using Bottleneck Transformers Arunima Jaiswal Ananya Sadana MedIm 18 2 0 01 May 2023
Hyneter: Hybrid Network Transformer for Object Detection Dong Chen Duoqian Miao Xuepeng Zhao ViT 27 3 0 18 Feb 2023
Multimodal Vision Transformers with Forced Attention for Behavior Analysis Tanay Agrawal Michal Balazia Philippe Muller Franccois Brémond ViT 23 9 0 07 Dec 2022
Semiconductor Defect Pattern Classification by Self-Proliferation-and-Attention Neural Network Yuanfu Yang Min Sun 22 6 0 01 Dec 2022
Time-rEversed diffusioN tEnsor Transformer: A new TENET of Few-Shot Object Detection Shan Zhang Naila Murray Lei Wang Piotr Koniusz ViT 27 16 0 30 Oct 2022
S2WAT: Image Style Transfer via Hierarchical Vision Transformer using Strips Window Attention Chi Zhang Xiaogang Xu Lei Wang Zaiyan Dai Jun Yang ViT 27 23 0 22 Oct 2022
Bridging the Gap Between Vision Transformers and Convolutional Neural Networks on Small Datasets Zhiying Lu Hongtao Xie Chuanbin Liu Yongdong Zhang ViT 12 57 0 12 Oct 2022
MOAT: Alternating Mobile Convolution and Attention Brings Strong Vision Models Chenglin Yang Siyuan Qiao Qihang Yu Xiaoding Yuan Yukun Zhu Alan Yuille Hartwig Adam Liang-Chieh Chen ViT MoE 30 58 0 04 Oct 2022
Feature Embedding by Template Matching as a ResNet Block Ada Gorgun Y. Z. Gürbüz Aydin Alatan 20 1 0 03 Oct 2022
Real-time 3D Single Object Tracking with Transformer Jiayao Shan Sifan Zhou Yubo Cui Zheng Fang ViT 20 50 0 02 Sep 2022
PointConvFormer: Revenge of the Point-based Convolution Wenxuan Wu Li Fuxin Qi Shan 3DPC 23 30 0 04 Aug 2022
Cost Aggregation with 4D Convolutional Swin Transformer for Few-Shot Segmentation Sunghwan Hong Seokju Cho Jisu Nam Stephen Lin Seung Wook Kim ViT 19 122 0 22 Jul 2022
Learning Sequence Representations by Non-local Recurrent Neural Memory Wenjie Pei Xin Feng Canmiao Fu Qi Cao Guangming Lu Yu-Wing Tai AI4TS 19 1 0 20 Jul 2022
Vision Transformers: From Semantic Segmentation to Dense Prediction Li Zhang Jiachen Lu Sixiao Zheng Xinxuan Zhao Xiatian Zhu Yanwei Fu Tao Xiang Jianfeng Feng Philip H. S. Torr ViT 24 7 0 19 Jul 2022
Vision Transformer for NeRF-Based View Synthesis from a Single Input Image Kai-En Lin Yen-Chen Lin Wei-Sheng Lai Tsung-Yi Lin Yichang Shih R. Ramamoorthi ViT 17 111 0 12 Jul 2022
Dual Vision Transformer Ting Yao Yehao Li Yingwei Pan Yu Wang Xiaoping Zhang Tao Mei ViT 141 75 0 11 Jul 2022
CMT-DeepLab: Clustering Mask Transformers for Panoptic Segmentation Qihang Yu Huiyu Wang Dahun Kim Siyuan Qiao Maxwell D. Collins Yukun Zhu Hartwig Adam Alan Yuille Liang-Chieh Chen ViT MedIm 32 89 0 17 Jun 2022
Dual Decomposition of Convex Optimization Layers for Consistent Attention in Medical Images Tom Ron M. Weiler-Sagie Tamir Hazan FAtt MedIm 19 6 0 06 Jun 2022
A Survey on Deep Learning for Skin Lesion Segmentation Z. Mirikharaji Kumar Abhishek Alceu Bissoto Catarina Barata Sandra Avila Eduardo Valle M. Celebi Ghassan Hamarneh 31 82 0 01 Jun 2022
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation Wenqiang Zhang Zilong Huang Guozhong Luo Tao Chen Xinggang Wang Wenyu Liu Gang Yu Chunhua Shen ViT 22 198 0 12 Apr 2022
MixFormer: Mixing Features across Windows and Dimensions Qiang Chen Qiman Wu Jian Wang Qinghao Hu T. Hu Errui Ding Jian Cheng Jingdong Wang MDE ViT 16 101 0 06 Apr 2022
FoV-Net: Field-of-View Extrapolation Using Self-Attention and Uncertainty Liqian Ma Stamatios Georgoulis Xu Jia Luc Van Gool 24 6 0 04 Apr 2022
Integrative Few-Shot Learning for Classification and Segmentation Dahyun Kang Minsu Cho VLM 24 59 0 29 Mar 2022
Beyond Fixation: Dynamic Window Visual Transformer Pengzhen Ren Changlin Li Guangrun Wang Yun Xiao Qing Du Xiaodan Liang Qing Du Xiaodan Liang Xiaojun Chang ViT 20 32 0 24 Mar 2022
Focal Modulation Networks Jianwei Yang Chunyuan Li Xiyang Dai Lu Yuan Jianfeng Gao 3DPC 22 263 0 22 Mar 2022
ScalableViT: Rethinking the Context-oriented Generalization of Vision Transformer Rui Yang Hailong Ma Jie Wu Yansong Tang Xuefeng Xiao Min Zheng Xiu Li ViT 19 53 0 21 Mar 2022
Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs Xiaohan Ding X. Zhang Yi Zhou Jungong Han Guiguang Ding Jian-jun Sun VLM 47 528 0 13 Mar 2022
Spherical Transformer Sungmin Cho Raehyuk Jung Junseok Kwon ViT 8 9 0 10 Feb 2022
Aggregating Global Features into Local Vision Transformer Krushi Patel A. Bur Fengju Li Guanghui Wang ViT 25 34 0 30 Jan 2022
DynaMixer: A Vision MLP Architecture with Dynamic Mixing Ziyu Wang Wenhao Jiang Yiming Zhu Li Yuan Yibing Song Wei Liu 37 43 0 28 Jan 2022
Structure and position-aware graph neural network for airway labeling Weiyi Xie Colin Jacobs Jean-Paul Charbonnier Bram van Ginneken 24 11 0 12 Jan 2022
SeMask: Semantically Masked Transformers for Semantic Segmentation Jitesh Jain Anukriti Singh Nikita Orlov Zilong Huang Jiachen Li Steven Walton Humphrey Shi ViT 27 92 0 23 Dec 2021
A Simple Single-Scale Vision Transformer for Object Localization and Instance Segmentation Wuyang Chen Xianzhi Du Fan Yang Lucas Beyer Xiaohua Zhai ... Huizhong Chen Jing Li Xiaodan Song Zhangyang Wang Denny Zhou ViT 21 20 0 17 Dec 2021
Fast Point Transformer Chunghyun Park Yoonwoo Jeong Minsu Cho Jaesik Park 3DPC ViT 30 168 0 09 Dec 2021
Local Similarity Pattern and Cost Self-Reassembling for Deep Stereo Matching Networks Biyang Liu Huimin Yu Yangqi Long 3DV 16 69 0 02 Dec 2021
On the Integration of Self-Attention and Convolution Xuran Pan Chunjiang Ge Rui Lu S. Song Guanfu Chen Zeyi Huang Gao Huang SSL 36 287 0 29 Nov 2021
Video Frame Interpolation Transformer Zhihao Shi Xiangyu Xu Xiaohong Liu Jun Chen Ming-Hsuan Yang ViT 15 157 0 27 Nov 2021
PointMixer: MLP-Mixer for Point Cloud Understanding Jaesung Choe Chunghyun Park François Rameau Jaesik Park In So Kweon 3DPC 36 98 0 22 Nov 2021
Swin Transformer V2: Scaling Up Capacity and Resolution Ze Liu Han Hu Yutong Lin Zhuliang Yao Zhenda Xie ... Yue Cao Zheng-Wei Zhang Li Dong Furu Wei B. Guo ViT 47 1,744 0 18 Nov 2021
Searching for TrioNet: Combining Convolution with Local and Global Self-Attention Huaijin Pi Huiyu Wang Yingwei Li Zizhang Li Alan Yuille ViT 19 3 0 15 Nov 2021
Full-attention based Neural Architecture Search using Context Auto-regression Yuan Zhou Haiyang Wang Shuwei Huo Boyu Wang 25 3 0 13 Nov 2021
A Survey of Visual Transformers Yang Liu Yao Zhang Yixin Wang Feng Hou Jin Yuan Jiang Tian Yang Zhang Zhongchao Shi Jianping Fan Zhiqiang He 3DGS ViT 71 330 0 11 Nov 2021
Relational Self-Attention: What's Missing in Attention for Video Understanding Manjin Kim Heeseung Kwon Chunyu Wang Suha Kwak Minsu Cho ViT 25 28 0 02 Nov 2021
HRFormer: High-Resolution Transformer for Dense Prediction Yuhui Yuan Rao Fu Lang Huang Weihong Lin Chao Zhang Xilin Chen Jingdong Wang ViT 24 226 0 18 Oct 2021