v1v2 (latest)

CoAtNet: Marrying Convolution and Attention for All Data Sizes

Neural Information Processing Systems (NeurIPS), 2021

9 June 2021

Mingxing Tan

Papers citing "CoAtNet: Marrying Convolution and Attention for All Data Sizes"

50 / 510 papers shown

Knowledge Migration Framework for Smart Contract Vulnerability Detection

Luqi Wang

Wenbao Jiang

327

15 Dec 2024

Joint multi-dimensional dynamic attention and transformer for general image restorationComputer Vision and Image Understanding (CVIU), 2024

358

12 Nov 2024

Breaking the Low-Rank Dilemma of Linear AttentionComputer Vision and Pattern Recognition (CVPR), 2024

Qihang Fan

Huaibo Huang

Ran He

509

12 Nov 2024

AsCAN: Asymmetric Convolution-Attention Networks for Efficient Recognition and GenerationNeural Information Processing Systems (NeurIPS), 2024

247

07 Nov 2024

Harmformer: Harmonic Networks Meet Transformers for Continuous Roto-Translation Equivariance

227

06 Nov 2024

Cross Feature Fusion of Fundus Image and Generated Lesion Map for Referable Diabetic Retinopathy ClassificationAsian Conference on Computer Vision (ACCV), 2024

196

06 Nov 2024

Expanding Sparse Tuning for Low Memory UsageNeural Information Processing Systems (NeurIPS), 2024

330

04 Nov 2024

MLLA-UNet: Mamba-like Linear Attention in an Efficient U-Shape Model for Medical Image Segmentation

289

31 Oct 2024

TEAM: Topological Evolution-aware Framework for Traffic Forecasting--Extended VersionProceedings of the VLDB Endowment (PVLDB), 2024

261

24 Oct 2024

DCT-HistoTransformer: Efficient Lightweight Vision Transformer with DCT Integration for histopathological image analysisIranian Conference on Biomedical Engineering (ICBME), 2024

Mahtab Ranjbar

Mehdi Mohebbi

Mahdi Cherakhloo

Bijan Vosoughi. Vahdat

MedIm

250

24 Oct 2024

SFB-net for cardiac segmentation: Bridging the semantic gap with attentionIEEE International Symposium on Biomedical Imaging (ISBI), 2023

177

24 Oct 2024

PETAH: Parameter Efficient Task Adaptation for Hybrid Transformers in a resource-limited Context

253

23 Oct 2024

Fuse Before Transfer: Knowledge Fusion for Heterogeneous Distillation

420

16 Oct 2024

MoH: Multi-Head Attention as Mixture-of-Head AttentionInternational Conference on Machine Learning (ICML), 2024

413

15 Oct 2024

Efficient Partitioning Vision Transformer on Edge Devices for Distributed InferenceIEEE International Conference on Distributed Computing Systems (ICDCS), 2024

247

15 Oct 2024

HorGait: A Hybrid Model for Accurate Gait Recognition in LiDAR Point Cloud Planar ProjectionsIEEE Access (IEEE Access), 2024

278

11 Oct 2024

QuadMamba: Learning Quadtree-based Selective Scan for Visual State Space ModelNeural Information Processing Systems (NeurIPS), 2024

Fei Xie

Weijia Zhang

Zhongdao Wang

Chao Ma

Mamba

284

09 Oct 2024

Guided Self-attention: Find the Generalized Necessarily Distinct Vectors for Grain Size Grading

121

08 Oct 2024

Bridging Local and Global Knowledge via Transformer in Board GamesInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

250

07 Oct 2024

Residual Kolmogorov-Arnold Network for Enhanced Deep Learning

Ray Congrui Yu

Sherry Wu

Jiang Gui

495

07 Oct 2024

Cross Resolution Encoding-Decoding For Detection Transformers

Ashish Kumar

Jaesik Park

ViT

178

05 Oct 2024

Designing Concise ConvNets with Columnar StagesInternational Conference on Learning Representations (ICLR), 2024

Ashish Kumar

Jaesik Park

375

05 Oct 2024

Universal Medical Image Representation Learning with Compositional Decoders

Kaini Wang

Ling Yang

Siping Zhou

Guangquan Zhou

Wentao Zhang

Bin Cui

Shuo Li

SSL MedIm

303

30 Sep 2024

Mammo-Clustering: A Multi-views Tri-level Information Fusion Context Clustering Framework for Localization and Classification in Mammography

...

567

23 Sep 2024

SparX: A Sparse Cross-Layer Connection Mechanism for Hierarchical Vision Mamba and Transformer NetworksAAAI Conference on Artificial Intelligence (AAAI), 2024

Meng Lou

Yunxiang Fu

Yizhou Yu

Mamba

285

15 Sep 2024

VFA: Vision Frequency Analysis of Foundation Models and Human

Mohammad Javad Darvishi Bayazi

209

09 Sep 2024

Efficient Training of Large Vision Models via Advanced Automated Progressive Learning

Changlin Li

266

06 Sep 2024

LowFormer: Hardware Efficient Design for Convolutional Transformer BackbonesIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2024

279

05 Sep 2024

TBConvL-Net: A Hybrid Deep Learning Architecture for Robust Medical Image SegmentationPattern Recognition (Pattern Recogn.), 2024

Tariq M. Khan

265

05 Sep 2024

The USTC-NERCSLIP Systems for the CHiME-8 NOTSOFAR-1 Challenge

...

Jia Pan

Jianqing Gao

316

03 Sep 2024

Dreaming is All You Need

Mingze Ni

Wei Liu

131

03 Sep 2024

A Preliminary Exploration Towards General Image Restoration

Xiangtao Kong

Jinjin Gu

Yihao Liu

Wenlong Zhang

237

27 Aug 2024

LoG-VMamba: Local-Global Vision Mamba for Medical Image Segmentation

178

26 Aug 2024

Accuracy Improvement of Cell Image Segmentation Using Feedback FormerIEEE Access (IEEE Access), 2024

Hinako Mitsuoka

Kazuhiro Hotta

ViT MedIm

548

23 Aug 2024

Sapiens: Foundation for Human Vision ModelsEuropean Conference on Computer Vision (ECCV), 2024

Su Zhaoen

444

170

22 Aug 2024

Enhancing 3D Transformer Segmentation Model for Medical Image with Token-level Representation LearningIEEE International Conference on Bioinformatics and Biomedicine (BIBM), 2024

Xinrong Hu

Yiyu Shi

136

12 Aug 2024

Efficient Visual Representation Learning with Heat Conduction EquationInternational Joint Conference on Artificial Intelligence (IJCAI), 2024

Zhemin Zhang

Xun Gong

DiffM 3DV

287

12 Aug 2024

DFE-IANet: A Method for Polyp Image Classification Based on Dual-domain Feature Extraction and Interaction Attention

Wei Wang

Jixing He

Xin Wang

296

30 Jul 2024

Lite-SAM Is Actually What You Need for Segment Everything

260

12 Jul 2024

iiANET: Inception Inspired Attention Hybrid Network for efficient Long-Range Dependency

Haruna Yunusa

Qin Shiyin

Abdulrahman Hamman Adama Chukkol

Isah Bello

A. Lawan

Isah Bello

285

10 Jul 2024

HDKD: Hybrid Data-Efficient Knowledge Distillation Network for Medical Image Classification

311

10 Jul 2024

Exploring Camera Encoder Designs for Autonomous Driving Perception

Jose M. Alvarez

254

09 Jul 2024

CTRL-F: Pairing Convolution with Transformer for Image Classification via Multi-Level Feature Cross-Attention and Representation Learning Fusion

237

09 Jul 2024

RepNeXt: A Fast Multi-Scale CNN using Structural Reparameterization

Mingshu Zhao

Yi Luo

Yong Ouyang

377

23 Jun 2024

Semantic Graph Consistency: Going Beyond Patches for Regularizing Self-Supervised Vision Transformers

Chaitanya Devaguptapu

Sumukh K. Aithal

Shrinivas Ramasubramanian

Moyuru Yamada

Manohar Kaul

ViT

316

18 Jun 2024

Multi-Dimensional Pruning: Joint Channel, Layer and Block Pruning with Latency Constraint

Jose Alvarez

282

17 Jun 2024

Enhancing Domain Adaptation through Prompt Gradient Alignment

Hoang Phan

Lam C. Tran

Quyen Tran

Trung Le

570

13 Jun 2024

AdaNCA: Neural Cellular Automata As Adaptors For More Robust Vision Transformer

386

12 Jun 2024

Towards Fundamentally Scalable Model Selection: Asymptotically Fast Update and Selection

Wenxiao Wang

Weiming Zhuang

Lingjuan Lyu

281

11 Jun 2024

ReduceFormer: Attention with Tensor Reduction by Summation

John Yang

Le An

Su Inn Park

166

11 Jun 2024