v1v2 (latest)

Advancing Medical Radiograph Representation Learning: A Hybrid Pre-training Paradigm with Multilevel Semantic Granularity

1 October 2024

Jiaxun Zhang

Papers citing "Advancing Medical Radiograph Representation Learning: A Hybrid Pre-training Paradigm with Multilevel Semantic Granularity"

45 / 45 papers shown

Title
PRIOR: Prototype Representation Joint Learning from Medical Images and ReportsIEEE International Conference on Computer Vision (ICCV), 2023 Pujin Cheng Li Lin Junyan Lyu Yijin Huang Tong Lu Xiaoying Tang MedIm 344 78 0 24 Jul 2023
Towards Unifying Medical Vision-and-Language Pre-training via Soft PromptsIEEE International Conference on Computer Vision (ICCV), 2023 Zhihong Chen Shizhe Diao Benyou Wang Guanbin Li Xiang Wan MedIm 292 44 0 17 Feb 2023
Multi-Granularity Cross-modal Alignment for Generalized Medical Visual Representation LearningNeural Information Processing Systems (NeurIPS), 2022 Fuying Wang Yuyin Zhou Shujun Wang V. Vardhanabhuti Lequan Yu 223 204 0 12 Oct 2022
Align, Reason and Learn: Enhancing Medical Vision-and-Language Pre-training with KnowledgeACM Multimedia (ACM MM), 2022 Zhihong Chen Guanbin Li Xiang Wan 268 92 0 15 Sep 2022
Multi-Modal Masked Autoencoders for Medical Vision-and-Language Pre-TrainingInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2022 Zhihong Chen Yu Du Jinpeng Hu Yang Liu Guanbin Li Xiang Wan Tsung-Hui Chang 238 155 0 15 Sep 2022
CoCa: Contrastive Captioners are Image-Text Foundation Models Jiahui Yu Zirui Wang Vijay Vasudevan Legg Yeung Mojtaba Seyedhosseini Yonghui Wu VLM CLIP OffRL 531 1,575 0 04 May 2022
Flamingo: a Visual Language Model for Few-Shot LearningNeural Information Processing Systems (NeurIPS), 2022 Jean-Baptiste Alayrac Jeff Donahue Pauline Luc Antoine Miech Iain Barr ... Mikolaj Binkowski Ricardo Barreira Oriol Vinyals Andrew Zisserman Karen Simonyan MLLM VLM 666 4,673 0 29 Apr 2022
Making the Most of Text Semantics to Improve Biomedical Vision--Language ProcessingEuropean Conference on Computer Vision (ECCV), 2022 Benedikt Boecking Naoto Usuyama Shruthi Bannur Daniel Coelho De Castro Anton Schwaighofer ... Tristan Naumann A. Nori Javier Alvarez-Valle Hoifung Poon Ozan Oktay 398 338 0 21 Apr 2022
Graph Enhanced Contrastive Learning for Radiology Findings SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022 Jinpeng Hu Zhuo Li Zhihong Chen Zhuguo Li Xiang Wan Tsung-Hui Chang MedIm 234 52 0 01 Apr 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and GenerationInternational Conference on Machine Learning (ICML), 2022 Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 1.2K 5,585 0 28 Jan 2022
SLIP: Self-supervision meets Language-Image Pre-trainingEuropean Conference on Computer Vision (ECCV), 2021 Norman Mu Alexander Kirillov David Wagner Saining Xie VLM CLIP 328 562 0 23 Dec 2021
Word Graph Guided Summarization for Radiology Findings Jinpeng Hu Jianling Li Zhihong Chen Yaling Shen Yan Song Xiang Wan Tsung-Hui Chang 119 42 0 18 Dec 2021
FLAVA: A Foundational Language And Vision Alignment Model Amanpreet Singh Ronghang Hu Vedanuj Goswami Guillaume Couairon Wojciech Galuba Marcus Rohrbach Douwe Kiela CLIP VLM 308 847 0 08 Dec 2021
Joint Learning of Localized Representations from Medical Images and ReportsEuropean Conference on Computer Vision (ECCV), 2021 Philipp Muller Georgios Kaissis Cong Zou Daniel Munich 360 110 0 06 Dec 2021
Masked Autoencoders Are Scalable Vision LearnersComputer Vision and Pattern Recognition (CVPR), 2021 Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 1.6K 9,791 0 11 Nov 2021
FILIP: Fine-grained Interactive Language-Image Pre-TrainingInternational Conference on Learning Representations (ICLR), 2021 Lewei Yao Runhu Huang Lu Hou Guansong Lu Minzhe Niu Hang Xu Xiaodan Liang Zhenguo Li Xin Jiang Chunjing Xu VLM CLIP 288 748 0 09 Nov 2021
Supervision Exists Everywhere: A Data Efficient Contrastive Language-Image Pre-training ParadigmInternational Conference on Learning Representations (ICLR), 2021 Yangguang Li Feng Liang Lichen Zhao Yufeng Cui Wanli Ouyang Jing Shao F. Yu Junjie Yan VLM CLIP 319 531 0 11 Oct 2021
SimVLM: Simple Visual Language Model Pretraining with Weak SupervisionInternational Conference on Learning Representations (ICLR), 2021 Zirui Wang Jiahui Yu Adams Wei Yu Zihang Dai Yulia Tsvetkov Yuan Cao VLM MLLM 591 901 0 24 Aug 2021
Scaling Vision TransformersComputer Vision and Pattern Recognition (CVPR), 2021 Xiaohua Zhai Alexander Kolesnikov N. Houlsby Lucas Beyer ViT 391 1,280 0 08 Jun 2021
Multi-modal Understanding and Generation for Medical Images and Text via Vision-Language Pre-TrainingIEEE journal of biomedical and health informatics (JBHI), 2021 Jong Hak Moon HyunGyung Lee W. Shin Young-Hak Kim Edward Choi MedIm 197 203 0 24 May 2021
Multiscale Vision TransformersIEEE International Conference on Computer Vision (ICCV), 2021 Haoqi Fan Bo Xiong K. Mangalam Yanghao Li Zhicheng Yan Jitendra Malik Christoph Feichtenhofer ViT 419 1,474 0 22 Apr 2021
MMBERT: Multimodal BERT Pretraining for Improved Medical VQAIEEE International Symposium on Biomedical Imaging (ISBI), 2021 Yash Khare Viraj Bagal Minesh Mathew Adithi Devi U. Priyakumar C. V. Jawahar MedIm 254 168 0 03 Apr 2021
Learning Transferable Visual Models From Natural Language SupervisionInternational Conference on Machine Learning (ICML), 2021 Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 1.9K 39,913 0 26 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text SupervisionInternational Conference on Machine Learning (ICML), 2021 Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 1.3K 4,768 0 11 Feb 2021
ViLT: Vision-and-Language Transformer Without Convolution or Region SupervisionInternational Conference on Machine Learning (ICML), 2021 Wonjae Kim Bokyung Son Ildoo Kim VLM CLIP 495 2,068 0 05 Feb 2021
Contrastive Learning of Medical Visual Representations from Paired Images and TextMachine Learning in Health Care (MLHC), 2020 Yuhao Zhang Hang Jiang Yasuhide Miura Christopher D. Manning C. Langlotz MedIm 602 922 0 02 Oct 2020
Attend to Medical Ontologies: Content Selection for Clinical Abstractive SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2020 Sajad Sotudeh Nazli Goharian Ross W. Filice 172 60 0 01 May 2020
Oscar: Object-Semantics Aligned Pre-training for Vision-Language TasksEuropean Conference on Computer Vision (ECCV), 2020 Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu ... Houdong Hu Li Dong Furu Wei Yejin Choi Jianfeng Gao VLM 603 2,115 0 13 Apr 2020
Improved Baselines with Momentum Contrastive Learning Xinlei Chen Haoqi Fan Ross B. Girshick Kaiming He SSL 891 3,747 0 09 Mar 2020
A Simple Framework for Contrastive Learning of Visual RepresentationsInternational Conference on Machine Learning (ICML), 2020 Ting-Li Chen Simon Kornblith Mohammad Norouzi Geoffrey E. Hinton SSL 1.1K 21,971 0 13 Feb 2020
Momentum Contrast for Unsupervised Visual Representation LearningComputer Vision and Pattern Recognition (CVPR), 2019 Kaiming He Haoqi Fan Yuxin Wu Saining Xie Ross B. Girshick SSL 1.0K 13,785 0 13 Nov 2019
VL-BERT: Pre-training of Generic Visual-Linguistic RepresentationsInternational Conference on Learning Representations (ICLR), 2019 Weijie Su Xizhou Zhu Yue Cao Bin Li Lewei Lu Furu Wei Jifeng Dai VLM MLLM SSL 553 1,786 0 22 Aug 2019
LXMERT: Learning Cross-Modality Encoder Representations from TransformersConference on Empirical Methods in Natural Language Processing (EMNLP), 2019 Hao Hao Tan Joey Tianyi Zhou VLM MLLM 618 2,734 0 20 Aug 2019
Unicoder-VL: A Universal Encoder for Vision and Language by Cross-modal Pre-trainingAAAI Conference on Artificial Intelligence (AAAI), 2019 Gen Li Nan Duan Yuejian Fang Ming Gong Daxin Jiang Ming Zhou SSL VLM MLLM 596 942 0 16 Aug 2019
VisualBERT: A Simple and Performant Baseline for Vision and Language Liunian Harold Li Mark Yatskar Da Yin Cho-Jui Hsieh Kai-Wei Chang VLM 530 2,173 0 09 Aug 2019
ViLBERT: Pretraining Task-Agnostic Visiolinguistic Representations for Vision-and-Language TasksNeural Information Processing Systems (NeurIPS), 2019 Jiasen Lu Dhruv Batra Devi Parikh Stefan Lee SSL VLM 836 4,151 0 06 Aug 2019
Publicly Available Clinical BERT Embeddings Emily Alsentzer John R. Murphy Willie Boag W. Weng Di Jin Tristan Naumann Matthew B. A. McDermott AI4MH 547 2,296 0 06 Apr 2019
MIMIC-CXR-JPG, a large publicly available database of labeled chest radiographs Alistair E. W. Johnson Tom Pollard Nathaniel R. Greenbaum M. Lungren Chih-ying Deng Yifan Peng Zhiyong Lu R. Mark Seth Berkowitz Steven Horng MedIm 586 954 0 21 Jan 2019
CheXpert: A Large Chest Radiograph Dataset with Uncertainty Labels and Expert Comparison Jeremy Irvin Pranav Rajpurkar M. Ko Yifan Yu Silviana Ciurea-Ilcus ... D. Larson C. Langlotz Bhavik Patel M. Lungren A. Ng 500 3,012 0 21 Jan 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 2.8K 106,623 0 11 Oct 2018
YOLOv3: An Incremental Improvement Joseph Redmon Ali Farhadi ObjD 767 23,796 0 08 Apr 2018
Attention Is All You NeedNeural Information Processing Systems (NeurIPS), 2017 Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 2.4K 157,684 0 12 Jun 2017
Feature Pyramid Networks for Object Detection Nayeon Lee Piotr Dollár Ross B. Girshick Kaiming He Bharath Hariharan Serge J. Belongie ObjD 1.3K 24,924 0 09 Dec 2016
Deep Residual Learning for Image Recognition Kaiming He Xinming Zhang Shaoqing Ren Jian Sun MedIm 3.6K 214,438 0 10 Dec 2015
U-Net: Convolutional Networks for Biomedical Image Segmentation Olaf Ronneberger Philipp Fischer Thomas Brox SSeg 3DV 2.9K 87,821 0 18 May 2015