v1v2 (latest)

Contrastive Learning of Medical Visual Representations from Paired Images and Text

2 October 2020

Yuhao Zhang

Hang Jiang

Yasuhide Miura

Christopher D. Manning

C. Langlotz

MedIm

ArXiv (abs)PDF HTML

Papers citing "Contrastive Learning of Medical Visual Representations from Paired Images and Text"

50 / 459 papers shown

Title
MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training Biao Wu Yutong Xie Zeyu Zhang Minh Hieu Phan Qi Chen Ling-Hao Chen Qi Wu LM&MA 99 0 0 28 Jul 2024
A Role-specific Guided Large Language Model for Ophthalmic Consultation Based on Stylistic Differentiation Laiyi Fu Binbin Fan Hongkai Du Yanxiang Feng Chunhua Li Huping Song LM&MA 46 0 0 26 Jul 2024
Masks and Manuscripts: Advancing Medical Pre-training with End-to-End Masking and Narrative Structuring Shreyank N. Gowda David A. Clifton MedIm 73 1 0 23 Jul 2024
Zero-Shot Embeddings Inform Learning and Forgetting with Vision-Language Encoders Laura Niss Kevin Vogt-Lowell Theodoros Tsiligkaridis VLM 95 1 0 22 Jul 2024
HERGen: Elevating Radiology Report Generation with Longitudinal Data Fuying Wang Shenghui Du Lequan Yu MedIm 77 6 0 21 Jul 2024
Fact-Aware Multimodal Retrieval Augmentation for Accurate Medical Radiology Report Generation Liwen Sun James Zhao Megan Han Chenyan Xiong MedIm 138 12 0 21 Jul 2024
Missing Modality Prediction for Unpaired Multimodal Learning via Joint Embedding of Unimodal Models Donggeun Kim Taesup Kim 76 4 0 17 Jul 2024
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization Jinlong Li Zequn Jie Elisa Ricci Lin Ma N. Sebe VLM 101 1 0 11 Jul 2024
LEMoN: Label Error Detection using Multimodal Neighbors Haoran Zhang Aparna Balagopalan Nassim Oufattole Hyewon Jeong Yan Wu Jiacheng Zhu Marzyeh Ghassemi 128 0 0 10 Jul 2024
GTP-4o: Modality-prompted Heterogeneous Graph Learning for Omni-modal Biomedical Representation Chenxin Li Xinyu Liu Cheng Wang Yifan Liu Weihao Yu Jing Shao Yixuan Yuan 93 18 0 08 Jul 2024
Multi-modal Masked Siamese Network Improves Chest X-Ray Representation Learning Saeed Shurrab Alejandro Guerra-Manzanares Farah E. Shamout 89 1 0 05 Jul 2024
ADAPT: Multimodal Learning for Detecting Physiological Changes under Missing Modalities Julie Mordacq Léo Milecki Maria Vakalopoulou Steve Oudot Vicky Kalogeiton OffRL MedIm 81 4 0 04 Jul 2024
Joint-Dataset Learning and Cross-Consistent Regularization for Text-to-Motion Retrieval Nicola Messina J. Sedmidubský Fabrizio Falchi Tomáš Rebok 80 0 0 02 Jul 2024
Duoduo CLIP: Efficient 3D Understanding with Multi-View Images Han-Hung Lee Yiming Zhang Angel X. Chang 3DPC 160 4 0 17 Jun 2024
A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery Yu Zhang Xiusi Chen Bowen Jin Sheng Wang Shuiwang Ji Wei Wang Jiawei Han 140 43 0 16 Jun 2024
Industrial Language-Image Dataset (ILID): Adapting Vision Foundation Models for Industrial Settings Keno Moenck Duc Trung Thieu Julian Koch Thorsten Schuppstuhl VLM 108 1 0 14 Jun 2024
Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms Miaosen Zhang Yixuan Wei Zhen Xing Yifei Ma Zuxuan Wu ... Zheng Zhang Qi Dai Chong Luo Xin Geng Baining Guo VLM 84 1 0 13 Jun 2024
Zoom and Shift are All You Need Jiahao Qin 70 2 0 13 Jun 2024
Generalization Beyond Data Imbalance: A Controlled Study on CLIP for Transferable Insights Xin Wen Bingchen Zhao Yilun Chen Jiangmiao Pang Xiaojuan Qi 116 4 0 31 May 2024
Knowledge-grounded Adaptation Strategy for Vision-language Models: Building Unique Case-set for Screening Mammograms for Residents Training Aisha Urooj Khan John W. Garrett Tyler Bradshaw Lonie R. Salkowski Jiwoong Jeong Amara Tariq Imon Banerjee VLM 78 2 0 30 May 2024
Unlocking the Power of Spatial and Temporal Information in Medical Multimodal Pre-training Jinxia Yang Fuchun Sun Wayne Xin Zhao Ji-Rong Wen 96 4 0 30 May 2024
CheXpert Plus: Augmenting a Large Chest X-ray Dataset with Text Radiology Reports, Patient Demographics and Additional Image Formats Pierre J. Chambon Jean-Benoit Delbrouck Thomas Sounack Shih-Cheng Huang Zhihong Chen Maya Varma Steven QH Truong Chu The Chuong Curtis P. Langlotz LM&MA 102 16 0 29 May 2024
Topological Perspectives on Optimal Multimodal Embedding Spaces Abdul Aziz Abdul Rahim BDL 83 0 0 29 May 2024
It's Not a Modality Gap: Characterizing and Addressing the Contrastive Gap Abrar Fahim Alex Murphy Alona Fyshe VLM 77 8 0 28 May 2024
SleepFM: Multi-modal Representation Learning for Sleep Across Brain Activity, ECG and Respiratory Signals Rahul Thapa Bryan He Magnus Ruud Kjær IV HyattE.Moore Gauri Ganjoo Emmanuel Mignot James Zou 78 16 0 28 May 2024
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale ZeMing Gong Austin T. Wang Joakim Bruslund Haurum Scott C. Lowe Graham W. Taylor Angel X. Chang Angel X. Chang 130 7 0 27 May 2024
RET-CLIP: A Retinal Image Foundation Model Pre-trained with Clinical Diagnostic Reports Jiawei Du Jia Guo Weihang Zhang Shengzhu Yang Hanruo Liu Huiqi Li Ningli Wang MedIm VLM 68 8 0 23 May 2024
Mammo-CLIP: A Vision Language Foundation Model to Enhance Data Efficiency and Robustness in Mammography Shantanu Ghosh Clare B. Poynton Shyam Visweswaran Kayhan Batmanghelich VLM 105 12 0 20 May 2024
Self-supervised vision-langage alignment of deep learning representations for bone X-rays analysis A. Englebert Anne-Sophie Collin O. Cornu Christophe De Vleeschouwer 74 1 0 14 May 2024
Open Challenges and Opportunities in Federated Foundation Models Towards Biomedical Healthcare Xingyu Li Lu Peng Yuping Wang Weihua Zhang AI4CE MedIm LM&MA 114 12 0 10 May 2024
Pseudo-Prompt Generating in Pre-trained Vision-Language Models for Multi-Label Medical Image Classification Yaoqin Ye Junjie Zhang Hongwei Shi MedIm VLM 74 1 0 10 May 2024
EVA-X: A Foundation Model for General Chest X-ray Analysis with Self-supervised Learning Jingfeng Yao Xinggang Wang Yuehao Song Huangxuan Zhao Jun Ma Yajie Chen Wenyu Liu Bo Wang ViT 82 6 0 08 May 2024
FreeBind: Free Lunch in Unified Multimodal Space via Knowledge Fusion Zehan Wang Ziang Zhang Xize Cheng Rongjie Huang Luping Liu ... Haifeng Huang Yang Zhao Tao Jin Peng Gao Zhou Zhao 76 10 0 08 May 2024
AAPL: Adding Attributes to Prompt Learning for Vision-Language Models Gahyeon Kim Sohee Kim Seokju Lee VLM 95 5 0 25 Apr 2024
ChEX: Interactive Localization and Region Description in Chest X-rays Philip Muller Georgios Kaissis Daniel Rueckert 88 5 0 24 Apr 2024
CT-GLIP: 3D Grounded Language-Image Pretraining with CT Scans and Radiology Reports for Full-Body Scenarios Jingyang Lin Yingda Xia Jianpeng Zhang Ke Yan Le Lu Jiebo Luo Ling Zhang VLM LM&MA MedIm 73 4 0 23 Apr 2024
A review of deep learning-based information fusion techniques for multimodal medical image classification Yi-Hsuan Li Mostafa EL HABIB DAHO Pierre-Henri Conze Rachid Zeghlache Hugo Le Boité R. Tadayoni B. Cochener M. Lamard G. Quellec 65 47 0 23 Apr 2024
Machine Learning Techniques for MRI Data Processing at Expanding Scale Taro Langner 85 0 0 22 Apr 2024
MedThink: Explaining Medical Visual Question Answering via Multimodal Decision-Making Rationale Xiaotang Gai Chenyi Zhou Jiaxiang Liu Yang Feng Jian Wu Zuo-Qiang Liu MedIm 99 6 0 18 Apr 2024
Knowledge-enhanced Visual-Language Pretraining for Computational Pathology Xiao Zhou Xiaoman Zhang Chaoyi Wu Ya Zhang Weidi Xie Yanfeng Wang VLM 119 7 0 15 Apr 2024
Global Contrastive Training for Multimodal Electronic Health Records with Language Supervision Yingbo Ma Suraj Kolla Zhenhong Hu Dhruv Kaliraman Victoria Nolan ... Jeremy A. Balch Tyler J. Loftus Parisa Rashidi A. Bihorac B. Shickel AI4TS 89 2 0 10 Apr 2024
Unified Multi-modal Diagnostic Framework with Reconstruction Pre-training and Heterogeneity-combat Tuning Yupei Zhang Li Pan Qiushi Yang Tan Li Zhen Chen 91 1 0 09 Apr 2024
Bootstrapping Chest CT Image Understanding by Distilling Knowledge from X-ray Expert Models Weiwei Cao Jianpeng Zhang Yingda Xia Tony C. W. Mok Zi Li X. Ye Le Lu Jian Zheng Yuxing Tang Ling Zhang 63 4 0 07 Apr 2024
DeViDe: Faceted medical knowledge for improved medical vision-language pre-training Haozhe Luo Ziyu Zhou Corentin Royer Anjany Sekuboyina Bjoern Menze VLM ViT MedIm 101 7 0 04 Apr 2024
Foundation Model for Advancing Healthcare: Challenges, Opportunities, and Future Directions Yuting He Fuxiang Huang Xinrui Jiang Yuxiang Nie Minghao Wang Jiguang Wang Hao Chen LM&MA AI4CE 140 37 0 04 Apr 2024
Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation Xiaoshuang Huang Hongxiang Li Meng Cao Long Chen Chenyu You Dong An VLM 97 5 0 03 Apr 2024
Continual Learning for Smart City: A Survey Li Yang Zhipeng Luo Shi-sheng Zhang Fei Teng Tian-Jie Li HAI 98 9 0 01 Apr 2024
X-MIC: Cross-Modal Instance Conditioning for Egocentric Action Generalization Anna Kukleva Fadime Sener Edoardo Remelli Bugra Tekin Eric Sauser Bernt Schiele Shugao Ma VLM EgoV 81 2 0 28 Mar 2024
Envisioning MedCLIP: A Deep Dive into Explainability for Medical Vision-Language Models Anees Ur Rehman Hashmi Dwarikanath Mahapatra Mohammad Yaqub VLM MedIm 43 2 0 27 Mar 2024
Residual-based Language Models are Free Boosters for Biomedical Imaging Zhixin Lai Jing Wu Suiyao Chen Yucheng Zhou N. Hovakimyan MedIm 94 31 0 26 Mar 2024