ZegCLIP: Towards Adapting CLIP for Zero-shot Semantic Segmentation

7 December 2022

Lingqiao Liu

Papers citing "ZegCLIP: Towards Adapting CLIP for Zero-shot Semantic Segmentation"

50 / 119 papers shown

Title
Split Matching for Inductive Zero-shot Semantic Segmentation Jialei Chen Xu Zheng Dongyue Li Chong Yi Seigo Ito D. Paudel Luc Van Gool Hiroshi Murase Daisuke Deguchi VLM 54 0 0 08 May 2025
Adversarial Robustness Analysis of Vision-Language Models in Medical Image Segmentation Anjila Budathoki Manish Dhakal AAML 34 0 0 05 May 2025
Logits DeConfusion with CLIP for Few-Shot Learning Shuo Li F. Liu Zehua Hao X. Wang Lingling Li X. Liu Puhua Chen Wenping Ma VLM 52 0 0 16 Apr 2025
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation Yongchao Feng Yajie Liu Shuai Yang Wenrui Cai J. Zhang ... Jiahui Lv Z. Liu Tengyuan Shi Qingjie Liu Y. Wang MLLM VLM 63 1 0 13 Apr 2025
SemiDAViL: Semi-supervised Domain Adaptation with Vision-Language Guidance for Semantic Segmentation Hritam Basak Zhaozheng Yin VLM 33 0 0 08 Apr 2025
SCAM: A Real-World Typographic Robustness Evaluation for Multimodal Foundation Models Justus Westerhoff Erblina Purellku Jakob Hackstein Jonas Loos Leo Pinetzki Lorenz Hufe AAML 28 0 0 07 Apr 2025
Simultaneous Learning of Optimal Transports for Training All-to-All Flow-Based Condition Transfer Model Kotaro Ikeda Masanori Koyama Jinzhe Zhang Kohei Hayashi Kenji Fukumizu OT 142 0 0 04 Apr 2025
Bridge the Gap Between Visual and Linguistic Comprehension for Generalized Zero-shot Semantic Segmentation Xiaoqing Guo W. J. Li Yixuan Yuan 55 0 0 31 Mar 2025
Semantic Segmentation of Transparent and Opaque Drinking Glasses with the Help of Zero-shot Learning Annalena Blänsdorf Tristan Wirth Arne Rak Thomas Pollabauer Volker Knauthe Arjan Kuijper VLM 42 0 0 19 Mar 2025
The Power of One: A Single Example is All it Takes for Segmentation in VLMs Mir Rayat Imtiaz Hossain Mennatullah Siam Leonid Sigal James J. Little MLLM VLM 79 0 0 13 Mar 2025
AA-CLIP: Enhancing Zero-shot Anomaly Detection via Anomaly-Aware CLIP Wenxin Ma Xu Zhang Qingsong Yao Fenghe Tang Chenxu Wu Y. Li Rui Yan Zihang Jiang S. Kevin Zhou VLM 62 0 0 09 Mar 2025
SGC-Net: Stratified Granular Comparison Network for Open-Vocabulary HOI Detection Xin Lin Chong Shi Zuopeng Yang Haojin Tang Zhili Zhou ObjD 31 0 0 01 Mar 2025
MESC-3D:Mining Effective Semantic Cues for 3D Reconstruction from a Single Image Shaoming Li Qing Cai Songqi Kong Runqing Tan Heng Tong Shiji Qiu Yongguo Jiang Z. Liu 3DV 3DPC 52 0 0 28 Feb 2025
Neural Antidote: Class-Wise Prompt Tuning for Purifying Backdoors in Pre-trained Vision-Language Models Jiawei Kong Hao Fang Sihang Guo Chenxi Qing Bin Chen Bin Wang Shu-Tao Xia AAML VLM 90 0 0 26 Feb 2025
SEM-CLIP: Precise Few-Shot Learning for Nanoscale Defect Detection in Scanning Electron Microscope Image Qian Jin Yuqi Jiang Xudong Lu Yumeng Liu Yining Chen Dawei Gao Qi Sun Cheng Zhuo 75 0 0 24 Feb 2025
Narrowing Information Bottleneck Theory for Multimodal Image-Text Representations Interpretability Zhiyu Zhu Zhibo Jin Jiayu Zhang Nan Yang Jiahao Huang Jianlong Zhou Fang Chen 41 0 0 16 Feb 2025
Dynamic Scene Understanding from Vision-Language Representations Shahaf Pruss Morris Alper Hadar Averbuch-Elor OCL 167 0 0 20 Jan 2025
AFANet: Adaptive Frequency-Aware Network for Weakly-Supervised Few-Shot Semantic Segmentation Jiaqi Ma Guo-Sen Xie Fang Zhao Zechao Li 32 0 0 23 Dec 2024
ResCLIP: Residual Attention for Training-free Dense Vision-language Inference Yuhang Yang Jinhong Deng Wen Li Lixin Duan VLM 81 0 0 24 Nov 2024
Test-time Alignment-Enhanced Adapter for Vision-Language Models Baoshun Tong Kaiyu Song Hanjiang Lai VLM 77 0 0 24 Nov 2024
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements M. Arda Aydın Efe Mert Çırpar Elvin Abdinli Gözde B. Ünal Y. Sahin VLM 71 0 0 18 Nov 2024
Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection Wentao Bao K. Li Yuxiao Chen Deep Patel Martin Renqiang Min Yu Kong VLM ObjD 42 2 0 17 Nov 2024
Harnessing Vision Foundation Models for High-Performance, Training-Free Open Vocabulary Segmentation Yuheng Shi Minjing Dong Chang Xu VLM 43 1 0 14 Nov 2024
TripletCLIP: Improving Compositional Reasoning of CLIP via Synthetic Vision-Language Negatives Maitreya Patel Abhiram Kusumba Sheng Cheng Changhoon Kim Tejas Gokhale Chitta Baral Yezhou Yang CoGe CLIP 54 7 0 04 Nov 2024
IPO: Interpretable Prompt Optimization for Vision-Language Models Yingjun Du Wenfang Sun Cees G. M. Snoek VLM 25 2 0 20 Oct 2024
LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration Yuang Ai Huaibo Huang Ran He 32 2 0 20 Oct 2024
A Survey of Low-shot Vision-Language Model Adaptation via Representer Theorem Kun Ding Ying Wang Gaofeng Meng Shiming Xiang VLM 29 0 0 15 Oct 2024
TuneVLSeg: Prompt Tuning Benchmark for Vision-Language Segmentation Models Rabin Adhikari Safal Thapaliya Manish Dhakal Bishesh Khanal MLLM VLM 35 0 0 07 Oct 2024
Towards Open-Vocabulary Semantic Segmentation Without Semantic Labels Heeseong Shin Chaehyun Kim Sunghwan Hong Seokju Cho Anurag Arnab Paul Hongsuck Seo Seungryong Kim VLM 34 1 0 30 Sep 2024
Annotation-Free Curb Detection Leveraging Altitude Difference Image Fulong Ma Peng Hou Yuxuan Liu Yang Liu Ming Liu Jun Ma 30 0 0 30 Sep 2024
You Only Speak Once to See Wenhao Yang Jianguo Wei Wenhuan Lu Lei Li VOS 35 1 0 27 Sep 2024
Recent Advances in OOD Detection: Problems and Approaches Shuo Lu YingSheng Wang Lijun Sheng Aihua Zheng Lingxiao He Jian Liang OODD 66 3 0 18 Sep 2024
CLIP Adaptation by Intra-modal Overlap Reduction A. Kravets V. Namboodiri VLM 37 0 0 17 Sep 2024
Generalization Boosted Adapter for Open-Vocabulary Segmentation Wenhao Xu Changwei Wang Xuxiang Feng Rongtao Xu Longzhao Huang Zherui Zhang Li Guo Shibiao Xu VLM 34 2 0 13 Sep 2024
DetailCLIP: Detail-Oriented CLIP for Fine-Grained Tasks Amin Karimi Monsefi Kishore Prakash Sailaja Ali Alilooee Ser-Nam Lim R. Ramnath VLM 37 6 0 10 Sep 2024
MROVSeg: Breaking the Resolution Curse of Vision-Language Models in Open-Vocabulary Semantic Segmentation Yuanbing Zhu Bingke Zhu Zhen Chen Huan Xu Ming Tang Jinqiao Wang VLM 34 0 0 27 Aug 2024
Image Segmentation in Foundation Model Era: A Survey Tianfei Zhou Fei Zhang Boyu Chang Wenguan Wang Ye Yuan E. Konukoglu Daniel Cremers VLM 42 4 0 23 Aug 2024
FIDAVL: Fake Image Detection and Attribution using Vision-Language Model Mamadou Keita W. Hamidouche Hessen Bougueffa Eutamene Abdelmalik Taleb-Ahmed Abdenour Hadid VLM 82 1 0 22 Aug 2024
Learning Precise Affordances from Egocentric Videos for Robotic Manipulation Gen Li Nikolaos Tsagkas Jifei Song Ruaridh Mon-Williams S. Vijayakumar Kun Shao Laura Sevilla-Lara 36 7 0 19 Aug 2024
Teach CLIP to Develop a Number Sense for Ordinal Regression Yao Du Qiang Zhai Weihang Dai X. Li 46 8 0 07 Aug 2024
Diffusion Feedback Helps CLIP See Better Wenxuan Wang Quan-Sen Sun Fan Zhang Yepeng Tang Jing Liu Xinlong Wang VLM 40 14 0 29 Jul 2024
Rethinking Video-Text Understanding: Retrieval from Counterfactually Augmented Data Wufei Ma Kai Li Zhongshi Jiang Moustafa Meshry Qihao Liu Huiyu Wang Christian Hane Alan L. Yuille VGen 40 1 0 18 Jul 2024
VCP-CLIP: A visual context prompting model for zero-shot anomaly segmentation Zhen Qu Xian Tao Mukesh Prasad Fei Shen Zhengtao Zhang Xinyi Gong Guiguang Ding VLM 36 11 0 17 Jul 2024
Textual Query-Driven Mask Transformer for Domain Generalized Segmentation Byeonghyun Pak Byeongju Woo Sunghwan Kim Dae-Hwan Kim Hoseong Kim 46 3 0 12 Jul 2024
Explore the Potential of CLIP for Training-Free Open Vocabulary Semantic Segmentation Tong Shao Zhuotao Tian Hang Zhao Jingyong Su VLM 36 15 0 11 Jul 2024
Exploring Phrase-Level Grounding with Text-to-Image Diffusion Model Danni Yang Ruohan Dong Jiayi Ji Yiwei Ma Haowei Wang Xiaoshuai Sun Rongrong Ji 44 3 0 07 Jul 2024
Knowledge Composition using Task Vectors with Learned Anisotropic Scaling Frederic Z. Zhang Paul Albert Cristian Rodriguez-Opazo Anton van den Hengel Ehsan Abbasnejad MoMe 53 7 0 03 Jul 2024
Fast and Efficient: Mask Neural Fields for 3D Scene Segmentation Zihan Gao Lingling Li Licheng Jiao Fang Liu Xu Liu Wenping Ma Yuwei Guo Shuyuan Yang 34 0 0 01 Jul 2024
Understanding Multi-Granularity for Open-Vocabulary Part Segmentation Jiho Choi Seonho Lee Seungho Lee Minhyun Lee Hyunjung Shim OCL 42 0 0 17 Jun 2024
UVIS: Unsupervised Video Instance Segmentation Shuaiyi Huang Saksham Suri Kamal Gupta Sai Saketh Rambhatla Ser-Nam Lim Abhinav Shrivastava VLM 39 3 0 11 Jun 2024