v1v2 (latest)

MambaVision: A Hybrid Mamba-Transformer Vision Backbone

10 July 2024

Ali Hatamizadeh

Jan Kautz

Mamba

ArXiv (abs)PDF HTML HuggingFace (33 upvotes)Github (2091★)

Papers citing "MambaVision: A Hybrid Mamba-Transformer Vision Backbone"

50 / 150 papers shown

DF-Mamba: Deformable State Space Modeling for 3D Hand Pose Estimation in Interactions

495

02 Dec 2025

PointNet4D: A Lightweight 4D Point Cloud Video Backbone for Online and Offline Perception in Robotic Applications

213

01 Dec 2025

MambaScope: Coarse-to-Fine Scoping for Efficient Vision Mamba

391

29 Nov 2025

PathMamba: A Hybrid Mamba-Transformer for Topologically Coherent Road Segmentation in Satellite Imagery

Jules Decaestecker

Nicolas Vigne

Mamba

409

26 Nov 2025

MambaEye: A Size-Agnostic Visual Encoder with Causal Sequential Processing

173

25 Nov 2025

RNN as Linear Transformer: A Closer Investigation into Representational Potentials of Visual Mamba Models

198

23 Nov 2025

Supervised Contrastive Learning for Few-Shot AI-Generated Image Detection and Attribution

Jaime Álvarez Urueña

David Camacho

Javier Huertas-Tato

235

20 Nov 2025

MambaTrack3D: A State Space Model Framework for LiDAR-Based Object Tracking under High Temporal Variation

312

19 Nov 2025

Systematic Evaluation of Time-Frequency Features for Binaural Sound Source Localization

153

17 Nov 2025

DensePercept-NCSSD: Vision Mamba towards Real-time Dense Visual Perception with Non-Causal State Space Duality

159

16 Nov 2025

Application of Graph Based Vision Transformers Architectures for Accurate Temperature Prediction in Fiber Specklegram Sensors

Abhishek Sebastian

186

15 Nov 2025

Adaptive Morph-Patch Transformer for Aortic Vessel Segmentation

243

10 Nov 2025

MVSMamba: Multi-View Stereo with State Space Model

227

03 Nov 2025

HieraMamba: Video Temporal Grounding via Hierarchical Anchor-Mamba Pooling

Joungbin An

Kristen Grauman

Mamba

295

27 Oct 2025

Simplifying Knowledge Transfer in Pretrained Models

Siddharth Jain

Shyamgopal Karthik

Vineet Gandhi

200

25 Oct 2025

StretchySnake: Flexible SSM Training Unlocks Action Recognition Across Spatio-Temporal Scales

203

17 Oct 2025

EdgeNavMamba: Mamba Optimized Object Detection for Energy Efficient Edge Devices

243

16 Oct 2025

End-to-End Multi-Modal Diffusion Mamba

195

15 Oct 2025

Learning Human Motion with Temporally Conditional Mamba

289

14 Oct 2025

Catch-Only-One: Non-Transferable Examples for Model-Specific Authorization

171

13 Oct 2025

Multimodal Learning with Augmentation Techniques for Natural Disaster Assessment

Adrian-Dinu Urse

Dumitru-Clementin Cercel

Florin-Catalin Pop

146

04 Oct 2025

Gather-Scatter Mamba: Accelerating Propagation with Efficient State Space Model

250

01 Oct 2025

Can Mamba Learn In Context with Outliers? A Theoretical Generalization Analysis

210

01 Oct 2025

AttentionViG: Cross-Attention-Based Dynamic Neighbor Aggregation in Vision GNNs

150

29 Sep 2025

StableDub: Taming Diffusion Prior for Generalized and Efficient Visual Dubbing

243

26 Sep 2025

Sequential Token Merging: Revisiting Hidden States

178

19 Sep 2025

UM-Depth : Uncertainty Masked Self-Supervised Monocular Depth Estimation with Visual Odometry

200

17 Sep 2025

VCMamba: Bridging Convolutions with Multi-Directional Mamba for Efficient Visual Representation

253

04 Sep 2025

DSGC-Net: A Dual-Stream Graph Convolutional Network for Crowd Counting via Feature Correlation Mining

379

02 Sep 2025

MV-SSM: Multi-View State Space Modeling for 3D Human Pose EstimationComputer Vision and Pattern Recognition (CVPR), 2025

Aviral Chharia

Wenbo Gou

Haoye Dong

172

31 Aug 2025

Characterizing the Behavior of Training Mamba-based State Space Models on GPUs

112

25 Aug 2025

Towards Efficient Vision State Space Models via Token Merging

Jinyoung Park

Minseok Son

Changick Kim

187

19 Aug 2025

SRMA-Mamba: Spatial Reverse Mamba Attention Network for Pathological Liver Segmentation in MRI Volumes

252

17 Aug 2025

ENA: Efficient N-dimensional Attention

Yibo Zhong

3DV AI4TS

160

16 Aug 2025

Multi-State Tracker: Enhancing Efficient Object Tracking via Multi-State Specialization and Interaction

111

15 Aug 2025

Security Analysis of ChatGPT: Threats and Privacy Risks

309

13 Aug 2025

Subjective and Objective Quality Assessment of Banding Artifacts on Compressed VideosIEEE Transactions on Image Processing (IEEE TIP), 2025

244

12 Aug 2025

RoadMamba: A Dual Branch Visual State Space Model for Road Surface Classification

220

02 Aug 2025

$$MV_{Hybrid}$: Improving Spatial Transcriptomics Prediction with Hybrid State Space-Vision Transformer Backbone in Pathology Vision Foundation Models$

MV_{Hybrid}

: Improving Spatial Transcriptomics Prediction with Hybrid State Space-Vision Transformer Backbone in Pathology Vision Foundation Models

142

01 Aug 2025

VMatcher: State-Space Semi-Dense Local Feature Matching

Ali Youssef

Mamba

223

31 Jul 2025

RadioMamba: Breaking the Accuracy-Efficiency Trade-off in Radio Map Construction via a Hybrid Mamba-UNetIEEE Transactions on Network Science and Engineering (IEEE TNS&E), 2025

217

28 Jul 2025

Onboard Hyperspectral Super-Resolution with Deep Pushbroom Neural NetworkRemote Sensing (RS), 2025

449

28 Jul 2025

VAMPIRE: Uncovering Vessel Directional and Morphological Information from OCTA Images for Cardiovascular Disease Risk Factor PredictionInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2025

210

26 Jul 2025

Explaining How Visual, Textual and Multimodal Encoders Share Concepts

Clément Cornet

Romaric Besançon

Hervé Le Borgne

201

24 Jul 2025

HybridTM: Combining Transformer and Mamba for 3D Semantic Segmentation

189

24 Jul 2025

SRMambaV2: Biomimetic Attention for Sparse Point Cloud Upsampling in Autonomous Driving

250

23 Jul 2025

A2Mamba: Attention-augmented State Space Models for Visual Recognition

264

22 Jul 2025

ThinkingViT: Matryoshka Thinking Vision Transformer for Elastic Inference

267

14 Jul 2025

A Memory-Efficient Framework for Deformable Transformer with Neural Architecture Search

161

13 Jul 2025

MUG: Pseudo Labeling Augmented Audio-Visual Mamba Network for Audio-Visual Video Parsing

380

02 Jul 2025