Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference

21 March 2024

Han Zhao

Pengxiang Ding

Siteng Huang

Papers citing "Cobra: Extending Mamba to Multi-Modal Large Language Model for Efficient Inference"

11 / 11 papers shown

Title
BIMBA: Selective-Scan Compression for Long-Range Video Question Answering Md. Mohaiminul Islam Tushar Nagarajan Huiyu Wang Gedas Bertasius Lorenzo Torresani 96 0 0 12 Mar 2025
VLAS: Vision-Language-Action Model With Speech Instructions For Customized Robot Manipulation Wei Zhao Pengxiang Ding M. Zhang Zhefei Gong Shuanghao Bai H. Zhao Donglin Wang 85 5 0 24 Feb 2025
Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework Zirui Song Jingpu Yang Yuan Huang Jonathan Tonglet Zeyu Zhang Tao Cheng Meng Fang Iryna Gurevych X. Chen LRM 65 1 0 19 Feb 2025
GiVE: Guiding Visual Encoder to Perceive Overlooked Information Junjie Li Jianghong Ma Xiaofeng Zhang Yuhang Li Jianyang Shi 23 0 0 26 Oct 2024
UmambaTSF: A U-shaped Multi-Scale Long-Term Time Series Forecasting Method Using Mamba Li Wu Wenbin Pei Jiulong Jiao Qiang Zhang Mamba AI4TS 25 2 0 15 Oct 2024
Mambular: A Sequential Model for Tabular Deep Learning Anton Thielmann Manish Kumar Christoph Weisser Arik Reuter Benjamin Säfken Soheila Samiee Mamba LMTD 68 6 0 12 Aug 2024
Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models Byung-Kwan Lee Chae Won Kim Beomchan Park Yonghyun Ro MLLM LRM 22 17 0 24 May 2024
MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection Haoyang He Yuhu Bai Jiangning Zhang Qingdong He Hongxu Chen Zhenye Gan Chengjie Wang Xiangtai Li Guanzhong Tian Lei Xie Mamba 58 33 0 09 Apr 2024
LLaVA-Phi: Efficient Multi-Modal Assistant with Small Language Model Yichen Zhu Minjie Zhu Ning Liu Zhicai Ou Xiaofeng Mou Jian Tang 66 91 0 04 Jan 2024
Structured State Space Models for In-Context Reinforcement Learning Chris Xiaoxuan Lu Yannick Schroecker Albert Gu Emilio Parisotto Jakob N. Foerster Satinder Singh Feryal M. P. Behbahani AI4TS 84 81 0 07 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 256 4,223 0 30 Jan 2023