v1v2 (latest)

CoAtNet: Marrying Convolution and Attention for All Data Sizes

Neural Information Processing Systems (NeurIPS), 2021

9 June 2021

Mingxing Tan

Papers citing "CoAtNet: Marrying Convolution and Attention for All Data Sizes"

50 / 510 papers shown

EVCC: Enhanced Vision Transformer-ConvNeXt-CoAtNet Fusion for Classification

Muhammad Abdullah Adnan

ViT

24 Nov 2025

GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning

301

19 Nov 2025

Multi-refined Feature Enhanced Sentiment Analysis Using Contextual Instruction

174

01 Nov 2025

Kernelized Sparse Fine-Tuning with Bi-level Parameter Competition for Vision Models

136

28 Oct 2025

Attentive Convolution: Unifying the Expressivity of Self-Attention with Convolutional Efficiency

141

23 Oct 2025

Translution: Unifying Self-attention and Convolution for Adaptive and Relative Modeling

11 Oct 2025

Universal Neural Architecture Space: Covering ConvNets, Transformers and Everything in Between

Ondřej Týbl

Lukáš Neumann

AI4CE

208

07 Oct 2025

Hierarchical Deep Fusion Framework for Multi-dimensional Facial Forgery Detection - The 2024 Global Deepfake Image Detection Challenge

112

16 Sep 2025

SAGA: Selective Adaptive Gating for Efficient and Expressive Linear Attention

Yuan Cao

Dong Wang

16 Sep 2025

LEGO: Spatial Accelerator Generation and Optimization for Tensor ApplicationsInternational Symposium on High-Performance Computer Architecture (HPCA), 2025

Yujun Lin

Zhekai Zhang

Song Han

151

15 Sep 2025

CoAtNeXt:An Attention-Enhanced ConvNeXtV2-Transformer Hybrid Model for Gastric Tissue Classification

Mustafa Yurdakul

Şakir Tasdemir

11 Sep 2025

Leveraging Transfer Learning and Mobile-enabled Convolutional Neural Networks for Improved Arabic Handwritten Character RecognitionIEEE Access (IEEE Access), 2025

Mohsine El Khayati

Ayyad Maafiri

Yassine Himeur

Hamzah Ali Alkhazaleh

Shadi Atalla

Wathiq Mansoor

106

05 Sep 2025

VCMamba: Bridging Convolutions with Multi-Directional Mamba for Efficient Visual Representation

224

04 Sep 2025

Image Quality Assessment for Machines: Paradigm, Large-scale Database, and Models

Xiaoqi Wang

Yun Zhang

Weisi Lin

148

27 Aug 2025

The Maximum Coverage Model and Recommendation System for UAV Vertiports Location Planning

171

18 Aug 2025

Learning Spatial Decay for Vision Transformers

133

13 Aug 2025

Topological Structure Description for Artcode Detection Using the Shape of Orientation Histogram

105

13 Aug 2025

Calibration Attention: Instance-wise Temperature Scaling for Vision Transformers

142

12 Aug 2025

A Guide to Robust Generalization: The Impact of Architecture, Pre-training, and Optimization Strategy

156

12 Aug 2025

UniConvNet: Expanding Effective Receptive Field while Maintaining Asymptotically Gaussian Distribution for ConvNets of Any Scale

Yuhao Wang

Wei Xi

214

12 Aug 2025

GVCCS: A Dataset for Contrail Identification and Tracking on Visible Whole Sky Camera Sequences

Stephania-Denisa Bocu

220

24 Jul 2025

Iwin Transformer: Hierarchical Vision Transformer using Interleaved Windows

Simin Huo

Ning Li

ViT

243

24 Jul 2025

Vision Transformers for End-to-End Quark-Gluon Jet Classification from Calorimeter Images

141

17 Jun 2025

Uncertainty-Aware Remaining Lifespan Prediction from Images

222

16 Jun 2025

DuoFormer: Leveraging Hierarchical Representations by Local and Global Attention Vision Transformer

149

15 Jun 2025

DeepTraverse: A Depth-First Search Inspired Network for Algorithmic Visual Understanding

Bin Guo

John H.L. Hansen

224

11 Jun 2025

Bayesian Neural Scaling Law Extrapolation with Prior-Data Fitted Networks

376

29 May 2025

Structured Initialization for Vision Transformers

Jianqiao Zheng

Xueqian Li

Hemanth Saratchandran

Simon Lucey

ViT

209

26 May 2025

PiT: Progressive Diffusion Transformer

612

19 May 2025

Unified Sparse-Matrix Representations for Diverse Neural Architectures

Yuzhou Zhu

174

11 May 2025

ORXE: Orchestrating Experts for Dynamically Configurable Efficiency

247

07 May 2025

False Promises in Medical Imaging AI? Assessing Validity of Outperformance Claims

Evangelia Christodoulou

...

287

07 May 2025

DCS-ST for Classification of Breast Cancer Histopathology Images with Limited AnnotationsApplied Sciences (AS), 2025

Liu Suxing

Byungwon Min

451

06 May 2025

Corner Cases: How Size and Position of Objects Challenge ImageNet-Trained Models

Mishal Fatima

Steffen Jung

Margret Keuper

286

06 May 2025

Making Acoustic Side-Channel Attacks on Noisy Keyboards Viable with LLM-Assisted Spectrograms' "Typo" CorrectionWorkshop on Offensive Technologies (WOOT), 2025

133

15 Apr 2025

GFT: Gradient Focal Transformer

212

14 Apr 2025

DefMamba: Deformable Visual State Space ModelComputer Vision and Pattern Recognition (CVPR), 2025

344

08 Apr 2025

HGFormer: Topology-Aware Vision Transformer with HyperGraph LearningIEEE transactions on multimedia (TMM), 2025

612

03 Apr 2025

Spectral-Adaptive Modulation Networks for Visual Perception

423

31 Mar 2025

LSNet: See Large, Focus SmallComputer Vision and Pattern Recognition (CVPR), 2025

296

29 Mar 2025

vGamba: Attentive State Space Bottleneck for efficient Long-range Dependencies in Visual Recognition

Yunusa Haruna

A. Lawan

Mamba

591

27 Mar 2025

DVHGNN: Multi-Scale Dilated Vision HGNN for Efficient Vision RecognitionComputer Vision and Pattern Recognition (CVPR), 2025

262

19 Mar 2025

A Comprehensive LLM-powered Framework for Driving Intelligence EvaluationIEEE International Conference on Robotics and Automation (ICRA), 2025

256

07 Mar 2025

TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba

362

21 Feb 2025

E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D Medical Image SegmentationNeural Information Processing Systems (NeurIPS), 2023

Decebal Constantin Mocanu

M. V. Keulen

Elena Mocanu

MedIm

332

20 Feb 2025

DFCon: Attention-Driven Supervised Contrastive Learning for Robust Deepfake Detection

MD Sadik Hossain Shanto

Mahir Labib Dihan

Souvik Ghosh

Riad Ahmed Anonto

Hafijul Hoque Chowdhury

...

Rakib Ahsan

Md Tanvir Hassan

MD Roqunuzzaman Sojib

Sheikh Azizul Hakim

M. Saifur Rahman

CVBM

219

28 Jan 2025

Deep-BrownConrady: Prediction of Camera Calibration and Distortion Parameters Using Deep Learning and Synthetic DataIEEE Transactions on Automation Science and Engineering (T-ASE), 2025

Faiz Muhammad Chaudhry

162

24 Jan 2025

Parallel Sequence Modeling via Generalized Spatial Propagation NetworkComputer Vision and Pattern Recognition (CVPR), 2025

837

21 Jan 2025

VMamba: Visual State Space ModelNeural Information Processing Systems (NeurIPS), 2024

1.1K

1,522

31 Dec 2024

Unity is Strength: Unifying Convolutional and Transformeral Features for Better Person Re-Identification

241

23 Dec 2024