Multi-Modal Foundation Models for Computational Pathology: A Survey

12 March 2025

Papers citing "Multi-Modal Foundation Models for Computational Pathology: A Survey"

28 / 28 papers shown

Title
Pathology Report Generation and Multimodal Representation Learning for Cutaneous Melanocytic Lesions R. Lucassen Sander P.J. Moonemans Tijn van de Luijtgaarden Gerben E. Breimer W. Blokx M. Veta MedIm 78 2 0 26 Feb 2025
Foundation Models in Computational Pathology: A Review of Challenges, Opportunities, and Impact M. Bilal Aadam M. Raza Youssef Altherwy Anas Alsuhaibani Abdulrahman Abduljabbar Fahdah Almarshad Paul Golding Nasir M. Rajpoot MedIm LM&MA 81 7 0 12 Feb 2025
Molecular-driven Foundation Model for Oncologic Pathology Anurag J. Vaidya Andrew Zhang Guillaume Jaume Andrew H. Song Tong Ding ... Connor Bossi Keith L. Ligon Georg Gerber L. Le Faisal Mahmood VLM AI4CE 89 14 0 28 Jan 2025
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs Sheng Zhang Yanbo Xu Naoto Usuyama Hanwen Xu J. Bagga ... Carlo Bifulco M. Lungren Tristan Naumann Sheng Wang Hoifung Poon LM&MA MedIm 182 222 0 10 Jan 2025
SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding Ying Chen Guoan Wang Yuanfeng Ji Yanjun Li Jin Ye Tianbin Li Bin Zhang Nana Pei Rongshan Yu Yu Qiao VLM LM&MA 85 4 0 15 Oct 2024
Virchow2: Scaling Self-Supervised Mixed Magnification Models in Pathology Eric Zimmermann Eugene Vorontsov Julian Viret Adam Casson Michal Zelechowski ... Razik Yousfi Thomas J. Fuchs Nicolò Fusi Siqi Liu Kristen Severson MedIm 75 36 0 01 Aug 2024
A Multimodal Knowledge-enhanced Whole-slide Pathology Foundation Model Yingxue Xu Yihui Wang Fengtao Zhou Jiabo Ma Shu Yang ... Anjia Han Ronald Cheong Kin Chan Li Liang Xiuming Zhang Hao Chen 65 18 0 22 Jul 2024
PathAlign: A vision-language model for whole slide images in histopathology Faruk Ahmed Andrew Sellergren Lin Yang Shawn Xu Boris Babenko ... S. Shetty Daniel Golden Yun-Hui Liu David F. Steiner Ellery Wulczyn LM&MA VLM 58 17 0 27 Jun 2024
Transcriptomics-guided Slide Representation Learning in Computational Pathology Guillaume Jaume Lukas Oldenburg Anurag J. Vaidya Richard J. Chen Drew F. K. Williamson Thomas Peeters Andrew H. Song Faisal Mahmood 67 27 0 19 May 2024
Knowledge-enhanced Visual-Language Pretraining for Computational Pathology Xiao Zhou Xiaoman Zhang Chaoyi Wu Ya Zhang Weidi Xie Yanfeng Wang VLM 101 7 0 15 Apr 2024
HistGen: Histopathology Report Generation via Local-Global Feature Encoding and Cross-modal Context Interaction Zhengrui Guo Jiabo Ma Ying Xu Yihui Wang Liansheng Wang Hao Chen 84 21 0 08 Mar 2024
Quilt-LLaVA: Visual Instruction Tuning by Extracting Localized Narratives from Open-Source Histopathology Videos M. S. Seyfioglu Wisdom O. Ikezogwo Fatemeh Ghezloo Ranjay Krishna Linda G. Shapiro 98 43 0 07 Dec 2023
InternLM-XComposer: A Vision-Language Large Model for Advanced Text-image Comprehension and Composition Pan Zhang Xiaoyi Wang Bin Wang Yuhang Cao Chao Xu ... Conghui He Xingcheng Zhang Yu Qiao Da Lin Jiaqi Wang MLLM 118 234 0 26 Sep 2023
Virchow: A Million-Slide Digital Pathology Foundation Model Eugene Vorontsov Alican Bozkurt Adam Casson George Shaikovski Michal Zelechowski ... Razik Yousfi Christopher Kanan David Klimstra B. Rothrock Thomas J. Fuchs MedIm 37 87 0 14 Sep 2023
Visual Language Pretrained Multiple Instance Zero-Shot Transfer for Histopathology Images Ming Y. Lu Bowen Chen Andrew Zhang Drew F. K. Williamson Richard J. Chen Tong Ding L. Le Yung-Sung Chuang Faisal Mahmood VLM MedIm 142 101 0 13 Jun 2023
Sigmoid Loss for Language Image Pre-Training Xiaohua Zhai Basil Mustafa Alexander Kolesnikov Lucas Beyer CLIP VLM 126 1,119 0 27 Mar 2023
EVA: Exploring the Limits of Masked Visual Representation Learning at Scale Yuxin Fang Wen Wang Binhui Xie Quan-Sen Sun Ledell Yu Wu Xinggang Wang Tiejun Huang Xinlong Wang Yue Cao VLM CLIP 166 706 0 14 Nov 2022
Masked Siamese Networks for Label-Efficient Learning Mahmoud Assran Mathilde Caron Ishan Misra Piotr Bojanowski Florian Bordes Pascal Vincent Armand Joulin Michael G. Rabbat Nicolas Ballas SSL 75 318 0 14 Apr 2022
iBOT: Image BERT Pre-Training with Online Tokenizer Jinghao Zhou Chen Wei Huiyu Wang Wei Shen Cihang Xie Alan Yuille Tao Kong 70 729 0 15 Nov 2021
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 422 7,705 0 11 Nov 2021
TransMIL: Transformer based Correlated Multiple Instance Learning for Whole Slide Image Classification Zhucheng Shao Hao Bian Yang Chen Yifeng Wang Jian Zhang Xiangyang Ji Yongbing Zhang ViT MedIm 79 664 0 02 Jun 2021
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Ze Liu Yutong Lin Yue Cao Han Hu Yixuan Wei Zheng Zhang Stephen Lin B. Guo ViT 389 21,281 0 25 Mar 2021
Perceiver: General Perception with Iterative Attention Andrew Jaegle Felix Gimeno Andrew Brock Andrew Zisserman Oriol Vinyals João Carreira VLM ViT MDE 157 1,007 0 04 Mar 2021
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale Alexey Dosovitskiy Lucas Beyer Alexander Kolesnikov Dirk Weissenborn Xiaohua Zhai ... Matthias Minderer G. Heigold Sylvain Gelly Jakob Uszkoreit N. Houlsby ViT 512 40,739 0 22 Oct 2020
Survey on Deep Multi-modal Data Analytics: Collaboration, Rivalry and Fusion Yang Wang 83 198 0 15 Jun 2020
Publicly Available Clinical BERT Embeddings Emily Alsentzer John R. Murphy Willie Boag W. Weng Di Jin Tristan Naumann Matthew B. A. McDermott AI4MH 132 1,968 0 06 Apr 2019
BioBERT: a pre-trained biomedical language representation model for biomedical text mining Jinhyuk Lee Wonjin Yoon Sungdong Kim Donghyeon Kim Sunkyu Kim Chan Ho So Jaewoo Kang OOD 134 5,628 0 25 Jan 2019
Semi-Supervised Classification with Graph Convolutional Networks Thomas Kipf Max Welling GNN SSL 559 28,964 0 09 Sep 2016