Cross-Modal Conditioned Reconstruction for Language-guided Medical Image
Segmentation

Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation

3 April 2024

Xiaoshuang Huang

Papers citing "Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation"

12 / 12 papers shown

Title
MELTR: Meta Loss Transformer for Learning to Fine-tune Video Foundation Models Dohwan Ko Joon-Young Choi Hyeong Kyu Choi Kyoung-Woon On Byungseok Roh Hyunwoo J. Kim 36 17 0 23 Mar 2023
Multi-Modal Masked Autoencoders for Medical Vision-and-Language Pre-Training Zhihong Chen Yu Du Jinpeng Hu Yang Liu Guanbin Li Xiang Wan Tsung-Hui Chang 58 107 0 15 Sep 2022
LViT: Language meets Vision Transformer in Medical Image Segmentation Zihan Li Yunxiang Li Qingde Li Puyang Wang Dazhou Guo Le Lu D. Jin You Zhang Qingqi Hong VLM MedIm 51 128 0 29 Jun 2022
LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang Jiaqi Wang Yansong Tang Kai-xiang Chen Hengshuang Zhao Philip H. S. Torr 117 308 0 04 Dec 2021
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 255 7,337 0 11 Nov 2021
UCTransNet: Rethinking the Skip Connections in U-Net from a Channel-wise Perspective with Transformer Haonan Wang Peng Cao Jiaqi Wang Osmar R. Zaiane MedIm ViT 117 692 0 09 Sep 2021
TransAttUnet: Multi-level Attention-guided U-Net with Transformer for Medical Image Segmentation Bingzhi Chen Yishu Liu Zheng-Wei Zhang Guangming Lu A. W. Kong MedIm ViT 89 204 0 12 Jul 2021
TransClaw U-Net: Claw U-Net with Transformers for Medical Image Segmentation Yao Chang Menghan Hu Zhai Guangtao Xiao-Ping Zhang MedIm ViT 66 96 0 12 Jul 2021
CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval Huaishao Luo Lei Ji Ming Zhong Yang Chen Wen Lei Nan Duan Tianrui Li CLIP VLM 298 771 0 18 Apr 2021
TransFuse: Fusing Transformers and CNNs for Medical Image Segmentation Yundong Zhang Huiye Liu Qiang Hu ViT MedIm 192 869 0 16 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 293 2,875 0 11 Feb 2021
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 226 74,467 0 18 May 2015