Scaling Up Biomedical Vision-Language Models: Fine-Tuning, Instruction Tuning, and Multi-Modal Learning

23 May 2025

Papers citing "Scaling Up Biomedical Vision-Language Models: Fine-Tuning, Instruction Tuning, and Multi-Modal Learning"

19 / 19 papers shown

Title
BiomedCLIP: a multimodal biomedical foundation model pretrained from fifteen million scientific image-text pairs Sheng Zhang Yanbo Xu Naoto Usuyama Hanwen Xu J. Bagga ... Carlo Bifulco M. Lungren Tristan Naumann Sheng Wang Hoifung Poon LM&MA MedIm 168 218 0 10 Jan 2025
GREEN: Generative Radiology Report Evaluation and Error Notation Sophie Ostmeier Justin Xu Zhihong Chen Maya Varma Louis Blankemeier ... Arne Edward Michalson Michael E. Moseley Curtis P. Langlotz Akshay S. Chaudhari Jean-Benoit Delbrouck MedIm 69 26 0 06 May 2024
Adapted Large Language Models Can Outperform Medical Experts in Clinical Text Summarization Dave Van Veen Cara Van Uden Louis Blankemeier Jean-Benoit Delbrouck Asad Aali ... C. Langlotz Jason Hom S. Gatidis John M. Pauly Akshay S. Chaudhari ELM AI4MH LM&MA 79 303 0 14 Sep 2023
Foundational Models Defining a New Era in Vision: A Survey and Outlook Muhammad Awais Muzammal Naseer Salman Khan Rao Muhammad Anwer Hisham Cholakkal M. Shah Ming-Hsuan Yang Fahad Shahbaz Khan VLM 103 123 0 25 Jul 2023
GPT-4 Technical Report OpenAI OpenAI OpenAI Josh Achiam Steven Adler Sandhini Agarwal Lama Ahmad ... Shengjia Zhao Tianhao Zheng Juntang Zhuang William Zhuk Barret Zoph LLMAG MLLM 647 13,788 0 15 Mar 2023
OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework Peng Wang An Yang Rui Men Junyang Lin Shuai Bai Zhikang Li Jianxin Ma Chang Zhou Jingren Zhou Hongxia Yang MLLM ObjD 120 865 0 07 Feb 2022
Exploring and Distilling Posterior and Prior Knowledge for Radiology Report Generation Fenglin Liu Xian Wu Shen Ge Wei Fan Yuexian Zou MedIm 55 256 0 13 Jun 2021
SciFive: a text-to-text transformer model for biomedical literature Long Phan J. Anibal H. Tran Shaurya Chanana Erol Bahadroglu Alec Peltekian G. Altan-Bonnet MedIm 33 148 0 28 May 2021
Learning Transferable Visual Models From Natural Language Supervision Alec Radford Jong Wook Kim Chris Hallacy Aditya A. Ramesh Gabriel Goh ... Amanda Askell Pamela Mishkin Jack Clark Gretchen Krueger Ilya Sutskever CLIP VLM 681 28,659 0 26 Feb 2021
SLAKE: A Semantically-Labeled Knowledge-Enhanced Dataset for Medical Visual Question Answering Bo Liu Li-Ming Zhan Li Xu Lin Ma Y. Yang Xiao-Ming Wu 49 248 0 18 Feb 2021
UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual Embeddings Using the Unified Medical Language System Metathesaurus George Michalopoulos Yuanxin Wang H. Kaka Helen H. Chen Alexander Wong 43 124 0 20 Oct 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 500 41,106 0 28 May 2020
CheXbert: Combining Automatic Labelers and Expert Annotations for Accurate Radiology Report Labeling Using BERT Akshay Smit Saahil Jain Pranav Rajpurkar Anuj Pareek A. Ng M. Lungren MedIm 34 329 0 20 Apr 2020
MedDialog: Two Large-scale Medical Dialogue Datasets Xuehai He Shu Chen Zeqian Ju Xiangyu Dong Hongchao Fang ... Ruisi Zhang Ruoyu Zhang Meng Zhou Penghui Zhu P. Xie LM&MA MedIm 33 174 0 07 Apr 2020
Scaling Laws for Neural Language Models Jared Kaplan Sam McCandlish T. Henighan Tom B. Brown B. Chess R. Child Scott Gray Alec Radford Jeff Wu Dario Amodei 451 4,662 0 23 Jan 2020
A Survey on Biomedical Image Captioning Vasiliki Kougia John Pavlopoulos Ion Androutsopoulos MedIm 44 82 0 26 May 2019
BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova VLM SSL SSeg 966 93,936 0 11 Oct 2018
Lessons from Natural Language Inference in the Clinical Domain Alexey Romanov Chaitanya P. Shivade LM&MA 40 268 0 21 Aug 2018
CIDEr: Consensus-based Image Description Evaluation Ramakrishna Vedantam C. L. Zitnick Devi Parikh 227 4,451 0 20 Nov 2014