Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation

3 April 2024

Papers citing "Cross-Modal Conditioned Reconstruction for Language-guided Medical Image Segmentation"

32 / 32 papers shown

Title
Mask Grounding for Referring Image Segmentation Yong Xien Chng Henry Zheng Yizeng Han Xuchong Qiu Gao Huang ISeg ObjD 93 19 0 19 Dec 2023
Beyond One-to-One: Rethinking the Referring Image Segmentation Yutao Hu Qixiong Wang Wenqi Shao Enze Xie Zhenguo Li Jungong Han Ping Luo 3DV 110 40 0 26 Aug 2023
SwinMM: Masked Multi-view with Swin Transformers for 3D Medical Image Segmentation Yiqing Wang Zihan Li Jieru Mei Zi-Ying Wei Li Liu Chen Wang Shengtian Sang Alan Yuille Cihang Xie Yuyin Zhou ViT MedIm 52 31 0 24 Jul 2023
Multi-Modal Mutual Attention and Iterative Interaction for Referring Image Segmentation Chang Liu Henghui Ding Yulun Zhang Xudong Jiang 82 49 0 24 May 2023
LIMITR: Leveraging Local Information for Medical Image-Text Representation Gefen Dawidowicz Elad Hirsch A. Tal 50 15 0 21 Mar 2023
Adding Conditional Control to Text-to-Image Diffusion Models Lvmin Zhang Anyi Rao Maneesh Agrawala AI4CE 133 4,106 1 10 Feb 2023
MAGE: MAsked Generative Encoder to Unify Representation Learning and Image Synthesis Tianhong Li Huiwen Chang Shlok Kumar Mishra Han Zhang Dina Katabi Dilip Krishnan 63 166 0 16 Nov 2022
EVA: Exploring the Limits of Masked Visual Representation Learning at Scale Yuxin Fang Wen Wang Binhui Xie Quan-Sen Sun Ledell Yu Wu Xinggang Wang Tiejun Huang Xinlong Wang Yue Cao VLM CLIP 176 716 0 14 Nov 2022
Multi-Modal Masked Autoencoders for Medical Vision-and-Language Pre-Training Zhihong Chen Yu Du Jinpeng Hu Yang Liu Guanbin Li Xiang Wan Tsung-Hui Chang 127 116 0 15 Sep 2022
LViT: Language meets Vision Transformer in Medical Image Segmentation Zihan Li Yunxiang Li Qingde Li Puyang Wang Dazhou Guo Le Lu D. Jin You Zhang Qingqi Hong VLM MedIm 90 138 0 29 Jun 2022
VQGAN-CLIP: Open Domain Image Generation and Editing with Natural Language Guidance Katherine Crowson Stella Biderman Daniel Kornis Dashiell Stander Eric Hallahan Louis Castricato Edward Raff CLIP 110 380 0 18 Apr 2022
Disentangled Representation Learning for Text-Video Retrieval Qiang Wang Yanhao Zhang Yun Zheng Pan Pan Xiansheng Hua 63 80 0 14 Mar 2022
CLIP-Event: Connecting Text and Images with Event Structures Manling Li Ruochen Xu Shuohang Wang Luowei Zhou Xudong Lin Chenguang Zhu Michael Zeng Heng Ji Shih-Fu Chang VLM CLIP 63 127 0 13 Jan 2022
Florence: A New Foundation Model for Computer Vision Lu Yuan Dongdong Chen Yi-Ling Chen Noel Codella Xiyang Dai ... Zhen Xiao Jianwei Yang Michael Zeng Luowei Zhou Pengchuan Zhang VLM 121 904 0 22 Nov 2021
Masked Autoencoders Are Scalable Vision Learners Kaiming He Xinlei Chen Saining Xie Yanghao Li Piotr Dollár Ross B. Girshick ViT TPM 451 7,739 0 11 Nov 2021
FILIP: Fine-grained Interactive Language-Image Pre-Training Lewei Yao Runhu Huang Lu Hou Guansong Lu Minzhe Niu Hang Xu Xiaodan Liang Zhenguo Li Xin Jiang Chunjing Xu VLM CLIP 94 634 0 09 Nov 2021
CPT: Colorful Prompt Tuning for Pre-trained Vision-Language Models Yuan Yao Ao Zhang Zhengyan Zhang Zhiyuan Liu Tat-Seng Chua Maosong Sun MLLM VPVLM VLM 281 222 0 24 Sep 2021
Vision-Language Transformer and Query Generation for Referring Segmentation Henghui Ding Chang-rui Liu Suchen Wang Xudong Jiang 73 263 0 12 Aug 2021
Swin-Unet: Unet-like Pure Transformer for Medical Image Segmentation Hu Cao Yueyue Wang Jieneng Chen Dongsheng Jiang Xiaopeng Zhang Qi Tian Manning Wang ViT MedIm 124 2,898 0 12 May 2021
TransFuse: Fusing Transformers and CNNs for Medical Image Segmentation Yundong Zhang Huiye Liu Qiang Hu ViT MedIm 249 922 0 16 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 443 3,842 0 11 Feb 2021
ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision Wonjae Kim Bokyung Son Ildoo Kim VLM CLIP 116 1,745 0 05 Feb 2021
Contrastive Learning of Medical Visual Representations from Paired Images and Text Yuhao Zhang Hang Jiang Yasuhide Miura Christopher D. Manning C. Langlotz MedIm 122 758 0 02 Oct 2020
Linguistic Structure Guided Context Modeling for Referring Image Segmentation Tianrui Hui Si Liu Shaofei Huang Guanbin Li Sansi Yu Faxi Zhang Jizhong Han 65 154 0 01 Oct 2020
MosMedData: Chest CT Scans With COVID-19 Related Findings Dataset Sergey P. Morozov Anna E. Andreychenko Nikolay A. Pavlov A. Vladzymyrskyy N. Ledikhova V. Gombolevskiy I. Blokhin P. Gelezhe A. Gonchar V. Chernina 37 247 0 13 May 2020
UNet 3+: A Full-Scale Connected UNet for Medical Image Segmentation Huimin Huang Lanfen Lin Ruofeng Tong Hongjie Hu Qiaowei Zhang Yutaro Iwamoto Xianhua Han Yenwei Chen Jian Wu SSeg 58 1,798 0 19 Apr 2020
PyTorch: An Imperative Style, High-Performance Deep Learning Library Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury ... Sasank Chilamkurthy Benoit Steiner Lu Fang Junjie Bai Soumith Chintala ODL 493 42,407 0 03 Dec 2019
Attention U-Net: Learning Where to Look for the Pancreas Ozan Oktay Jo Schlemper Loic Le Folgoc M. J. Lee M. Heinrich ... Jingyu Sun Nils Y. Hammerla Bernhard Kainz Ben Glocker Daniel Rueckert SSeg 159 5,042 0 11 Apr 2018
Recurrent Multimodal Interaction for Referring Image Segmentation Chenxi Liu Zhe Lin Xiaohui Shen Jimei Yang Xin Lu Alan Yuille EgoV 71 238 0 23 Mar 2017
Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization Ramprasaath R. Selvaraju Michael Cogswell Abhishek Das Ramakrishna Vedantam Devi Parikh Dhruv Batra FAtt 297 20,003 0 07 Oct 2016
Generation and Comprehension of Unambiguous Object Descriptions Junhua Mao Jonathan Huang Alexander Toshev Oana-Maria Camburu Alan Yuille Kevin Patrick Murphy ObjD 118 1,345 0 07 Nov 2015
Microsoft COCO: Common Objects in Context Nayeon Lee Michael Maire Serge J. Belongie Lubomir Bourdev Ross B. Girshick James Hays Pietro Perona Deva Ramanan C. L. Zitnick Piotr Dollár ObjD 413 43,638 0 01 May 2014