v1v2 (latest)

CoAtNet: Marrying Convolution and Attention for All Data Sizes

Neural Information Processing Systems (NeurIPS), 2021

9 June 2021

Mingxing Tan

Papers citing "CoAtNet: Marrying Convolution and Attention for All Data Sizes"

50 / 510 papers shown

Overparameterization from Computational ConstraintsNeural Information Processing Systems (NeurIPS), 2022

159

27 Aug 2022

Efficient Attention-free Video Shift Transformers

Adrian Bulat

Brais Martínez

Georgios Tzimiropoulos

ViT

211

23 Aug 2022

Image as a Foreign Language: BEiT Pretraining for All Vision and Vision-Language Tasks

...

609

706

22 Aug 2022

TaCo: Textual Attribute Recognition via Contrastive LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

250

22 Aug 2022

Conviformers: Convolutionally guided Vision Transformer

305

17 Aug 2022

SensorSCAN: Self-Supervised Learning and Deep Clustering for Fault Diagnosis in Chemical ProcessesArtificial Intelligence (AIJ), 2022

165

17 Aug 2022

In the Eye of Transformer: Global-Local Correlation for Egocentric Gaze EstimationBritish Machine Vision Conference (BMVC), 2022

Miao Liu

239

08 Aug 2022

Advancing Plain Vision Transformer Towards Remote Sensing Foundation ModelIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2022

Di Wang

Qiming Zhang

Yufei Xu

Jing Zhang

Bo Du

Dacheng Tao

Guang Dai

334

319

08 Aug 2022

Combined CNN Transformer Encoder for Enhanced Fine-grained Human Action Recognition

186

03 Aug 2022

A Novel Transformer Network with Shifted Window Cross-Attention for Spatiotemporal Weather ForecastingIEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing (IEEE JSTARS), 2022

Alabi Bojesomo

Hasan Al-Marzouqi

P. Liatsis

210

02 Aug 2022

HorNet: Efficient High-Order Spatial Interactions with Recursive Gated ConvolutionsNeural Information Processing Systems (NeurIPS), 2022

Yongming Rao

Wenliang Zhao

Yansong Tang

Jie Zhou

Ser-Nam Lim

Jiwen Lu

ViT

408

332

28 Jul 2022

Convolutional Embedding Makes Hierarchical Vision Transformer StrongerEuropean Conference on Computer Vision (ECCV), 2022

101

27 Jul 2022

TreeSketchNet: From Sketch To 3D Tree Parameters GenerationACM Transactions on Intelligent Systems and Technology (ACM TIST), 2022

167

25 Jul 2022

Online Continual Learning with Contrastive Vision TransformerEuropean Conference on Computer Vision (ECCV), 2022

172

24 Jul 2022

HybMT: Hybrid Meta-Predictor based ML Algorithm for Fast Test Vector GenerationAsia and South Pacific Design Automation Conference (ASP-DAC), 2022

Shruti Pandey

J. Jayadeva

S. Sarangi

180

22 Jul 2022

Cost Aggregation with 4D Convolutional Swin Transformer for Few-Shot SegmentationEuropean Conference on Computer Vision (ECCV), 2022

280

174

22 Jul 2022

Weakly Supervised Object Localization via Transformer with Implicit Spatial CalibrationEuropean Conference on Computer Vision (ECCV), 2022

318

21 Jul 2022

SplitMixer: Fat Trimmed From MLP-like Models

Ali Borji

Sikun Lin

188

21 Jul 2022

AutoDiCE: Fully Automated Distributed CNN Inference at the Edge

Xiaotian Guo

A. Pimentel

T. Stefanov

20 Jul 2022

Vision Transformers: From Semantic Segmentation to Dense PredictionInternational Journal of Computer Vision (IJCV), 2022

Li Zhang

270

19 Jul 2022

Towards Trustworthy Healthcare AI: Attention-Based Feature Learning for COVID-19 Screening With Chest Radiography

Pengcheng Xi

Alexander Wong

19 Jul 2022

Parameterization of Cross-Token Relations with Relative Positional Encoding for Vision MLPACM Multimedia (ACM MM), 2022

196

15 Jul 2022

Next-ViT: Next Generation Vision Transformer for Efficient Deployment in Realistic Industrial Scenarios

Rui Wang

Min Zheng

Xin Pan

ViT

229

199

12 Jul 2022

Pure Transformers are Powerful Graph LearnersNeural Information Processing Systems (NeurIPS), 2022

392

248

06 Jul 2022

Softmax-free Linear TransformersInternational Journal of Computer Vision (IJCV), 2022

Jiachen Lu

Junge Zhang

Xiatian Zhu

Jianfeng Feng

Tao Xiang

Li Zhang

ViT

211

05 Jul 2022

FFCNet: Fourier Transform-Based Frequency Learning and Complex Convolutional Network for Colon Disease ClassificationInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2022

109

04 Jul 2022

Rethinking Query-Key Pairwise Interactions in Vision Transformers

Cheng-rong Li

Yangxin Liu

213

01 Jul 2022

Measuring Forgetting of Memorized Training ExamplesInternational Conference on Learning Representations (ICLR), 2022

...

364

132

30 Jun 2022

Transfer Learning with Deep Tabular ModelsInternational Conference on Learning Representations (ICLR), 2022

283

30 Jun 2022

RevBiFPN: The Fully Reversible Bidirectional Feature Pyramid NetworkConference on Machine Learning and Systems (MLSys), 2022

193

28 Jun 2022

ZoDIAC: Zoneout Dropout Injection Attention Calculation

Zanyar Zohourianshahzadi

Terrance Boult

Jugal Kalita

256

28 Jun 2022

Revisiting Architecture-aware Knowledge Distillation: Smaller Models and Faster Search

Taehyeon Kim

Heesoo Myeong

Se-Young Yun

164

27 Jun 2022

Learning Viewpoint-Agnostic Visual Representations by Recovering Tokens in 3D SpaceNeural Information Processing Systems (NeurIPS), 2022

Jinghuan Shang

Srijan Das

Michael S. Ryoo

315

23 Jun 2022

A novel adversarial learning strategy for medical image classification

243

23 Jun 2022

Explanation-based Counterfactual Retraining(XCR): A Calibration Method for Black-box Models

154

22 Jun 2022

EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for Mobile Vision Applications

Muhammad Maaz

Abdelrahman M. Shaker

Hisham Cholakkal

Salman Khan

Syed Waqas Zamir

Rao Muhammad Anwer

Fahad Shahbaz Khan

ViT

291

292

21 Jun 2022

Vicinity Vision TransformerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Zhen Qin

Lingpeng Kong

206

21 Jun 2022

Global Context Vision TransformersInternational Conference on Machine Learning (ICML), 2022

465

189

20 Jun 2022

Video Capsule Endoscopy Classification using Focal Modulation Guided Convolutional Neural Network

Abhishek Srivastava

Nikhil Kumar Tomar

Ulas Bagci

Debesh Jha

MedIm

127

16 Jun 2022

Write and Paint: Generative Vision-Language Models are Unified Modal LearnersInternational Conference on Learning Representations (ICLR), 2022

294

15 Jun 2022

SP-ViT: Learning 2D Spatial Priors for Vision TransformersBritish Machine Vision Conference (BMVC), 2022

Lei Zhang

117

15 Jun 2022

Efficient Adaptive Ensembling for Image Classification

A. Bruno

Davide Moroni

M. Martinelli

187

15 Jun 2022

Differentiable Top-k Classification LearningInternational Conference on Machine Learning (ICML), 2022

273

15 Jun 2022

Peripheral Vision TransformerNeural Information Processing Systems (NeurIPS), 2022

238

14 Jun 2022

On Data Scaling in Masked Image ModelingComputer Vision and Pattern Recognition (CVPR), 2022

209

09 Jun 2022

Unveiling Transformers with LEGO: a synthetic reasoning task

417

101

09 Jun 2022

From Attribution Maps to Human-Understandable Explanations through Concept Relevance PropagationNature Machine Intelligence (Nat. Mach. Intell.), 2022

248

197

07 Jun 2022

EfficientFormer: Vision Transformers at MobileNet SpeedNeural Information Processing Systems (NeurIPS), 2022

712

519

02 Jun 2022

Transforming medical imaging with Transformers? A comparative review of key properties, current progresses, and future perspectives

Bennett A. Landman

433

144

02 Jun 2022

HiViT: Hierarchical Vision Transformer Meets Masked Image Modeling

255

30 May 2022