Unified Multi-modal Diagnostic Framework with Reconstruction Pre-training and Heterogeneity-combat Tuning

9 April 2024

Papers citing "Unified Multi-modal Diagnostic Framework with Reconstruction Pre-training and Heterogeneity-combat Tuning"

6 / 6 papers shown

Title
Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration Li Pan Yupei Zhang Qiushi Yang Tan Li Zhen Chen 49 0 0 05 Feb 2025
DeepMIM: Deep Supervision for Masked Image Modeling Sucheng Ren Fangyun Wei Samuel Albanie Zheng-Wei Zhang Han Hu VLM 52 20 0 15 Mar 2023
Masked Image Modeling with Local Multi-Scale Reconstruction Haoqing Wang Yehui Tang Yunhe Wang Jianyuan Guo Zhiwei Deng Kai Han 56 45 0 09 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 247 4,186 0 30 Jan 2023
Multi-Modal Masked Autoencoders for Medical Vision-and-Language Pre-Training Zhihong Chen Yu Du Jinpeng Hu Yang Liu Guanbin Li Xiang Wan Tsung-Hui Chang 79 107 0 15 Sep 2022
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 258 7,337 0 11 Nov 2021