Learning to Prompt for Vision-Language Models

2 September 2021

Papers citing "Learning to Prompt for Vision-Language Models"

50 / 391 papers shown

Title
HGCLIP: Exploring Vision-Language Models with Graph Representations for Hierarchical Understanding Peng Xia Xingtong Yu Ming Hu Lie Ju Zhiyong Wang Peibo Duan Zongyuan Ge VLM 54 9 0 23 Nov 2023
Adversarial Prompt Tuning for Vision-Language Models Jiaming Zhang Xingjun Ma Xin Wang Lingyu Qiu Jiaqi Wang Yu-Gang Jiang Jitao Sang AAML VPVLM VLM 30 18 0 19 Nov 2023
Rethinking Class-incremental Learning in the Era of Large Pre-trained Models via Test-Time Adaptation Imad Eddine Marouf Subhankar Roy Enzo Tartaglione Stéphane Lathuilière CLL 23 3 0 17 Oct 2023
Few-shot Action Recognition with Captioning Foundation Models Xiang Wang Shiwei Zhang Hangjie Yuan Yingya Zhang Changxin Gao Deli Zhao Nong Sang VLM 28 7 0 16 Oct 2023
LICO: Explainable Models with Language-Image Consistency Yiming Lei Zilong Li Yangyang Li Junping Zhang Hongming Shan VLM FAtt 17 7 0 15 Oct 2023
Sentence-level Prompts Benefit Composed Image Retrieval Yang Bai Xinxing Xu Yong-Jin Liu Salman Khan Fahad Khan Wangmeng Zuo Rick Siow Mong Goh Chun-Mei Feng 36 26 0 09 Oct 2023
PrototypeFormer: Learning to Explore Prototype Relationships for Few-shot Image Classification Feihong He Gang Li Hui Xiong VLM ViT 54 1 0 05 Oct 2023
Delving into CLIP latent space for Video Anomaly Recognition Luca Zanella Benedetta Liberatori Willi Menapace Fabio Poiesi Yiming Wang Elisa Ricci 25 22 0 04 Oct 2023
Zero-Shot and Few-Shot Video Question Answering with Multi-Modal Prompts Bipin Rajendran Bashir M. Al-Hashimi MLLM VLM 30 2 0 27 Sep 2023
BLIP-Adapter: Parameter-Efficient Transfer Learning for Mobile Screenshot Captioning Ching-Yu Chiang I-Hua Chang Shih-Wei Liao 44 1 0 26 Sep 2023
Dual-Modal Attention-Enhanced Text-Video Retrieval with Triplet Partial Margin Contrastive Learning Chen Jiang Hong Liu Xuzheng Yu Qing Wang Yuan Cheng ... Zhongyi Liu Qingpei Guo Wei Chu Ming Yang Yuan Qi 26 10 0 20 Sep 2023
SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels Henry Hengyuan Zhao Pichao Wang Yuyang Zhao Hao Luo F. Wang Mike Zheng Shou ViT 34 14 0 15 Sep 2023
Gradient constrained sharpness-aware prompt learning for vision-language models Liangchen Liu Nannan Wang Dawei Zhou Xinbo Gao Decheng Liu Xi Yang Tongliang Liu VLM 30 2 0 14 Sep 2023
Dynamic Visual Prompt Tuning for Parameter Efficient Transfer Learning Chunqing Ruan Hongjian Wang VLM VPVLM 32 1 0 12 Sep 2023
Bootstrap Fine-Grained Vision-Language Alignment for Unified Zero-Shot Anomaly Localization Hanqiu Deng Zhaoxiang Zhang Jinan Bao Xingyu Li VLM 27 4 0 30 Aug 2023
Efficient Model Personalization in Federated Learning via Client-Specific Prompt Generation Fu-En Yang Chien-Yi Wang Yu-Chiang Frank Wang VLM FedML 31 59 0 29 Aug 2023
Cross-Modal Retrieval Meets Inference:Improving Zero-Shot Classification with Cross-Modal Retrieval Seong-Hoon Eom Namgyu Ho Jaehoon Oh Se-Young Yun CLIP VLM 35 0 0 29 Aug 2023
Knowledge-Aware Prompt Tuning for Generalizable Vision-Language Models Baoshuo Kan Teng Wang Wenpeng Lu Xiantong Zhen Weili Guan Feng Zheng VPVLM VLM 28 25 0 22 Aug 2023
Link-Context Learning for Multimodal LLMs Yan Tai Weichen Fan Zhao Zhang Feng Zhu Rui Zhao Ziwei Liu ReLM LRM 21 17 0 15 Aug 2023
FocusFlow: Boosting Key-Points Optical Flow Estimation for Autonomous Driving Zhonghua Yi Haowen Shi Kailun Yang Qi Jiang Yaozu Ye Ze Wang Huajian Ni Kaiwei Wang 3DPC 20 9 0 14 Aug 2023
Exploring Part-Informed Visual-Language Learning for Person Re-Identification Y. Lin Cong Liu Yehansen Chen Jinshui Hu Bing Yin Baocai Yin Zengfu Wang 64 7 0 04 Aug 2023
Detecting Cloud Presence in Satellite Images Using the RGB-based CLIP Vision-Language Model Mikolaj Czerkawski Robert C. Atkinson Christos Tachtatzis VLM 25 2 0 01 Aug 2023
Bridging Vision and Language Encoders: Parameter-Efficient Tuning for Referring Image Segmentation Zunnan Xu Zhihong Chen Yong Zhang Yibing Song Xiang Wan Guanbin Li VLM 35 47 0 21 Jul 2023
UP-DP: Unsupervised Prompt Learning for Data Pre-Selection with Vision-Language Models Xin Li Sima Behpour T. Doan Wenbin He Liangke Gou Liu Ren VLM 50 3 0 20 Jul 2023
PatchCT: Aligning Patch Set and Label Set with Conditional Transport for Multi-Label Image Classification Miaoge Li Dongsheng Wang Xinyang Liu Zequn Zeng Ruiying Lu Bo Chen Mingyuan Zhou VLM OT 22 15 0 18 Jul 2023
LPN: Language-guided Prototypical Network for few-shot classification Kaihui Cheng Chule Yang Xiao Liu Naiyang Guan Zhiyuan Wang 47 0 0 04 Jul 2023
PM-DETR: Domain Adaptive Prompt Memory for Object Detection with Transformers Peidong Jia Jiaming Liu Senqiao Yang Jiarui Wu Xiaodong Xie Shanghang Zhang VLM 42 2 0 01 Jul 2023
2nd Place Winning Solution for the CVPR2023 Visual Anomaly and Novelty Detection Challenge: Multimodal Prompting for Data-centric Anomaly Detection Yunkang Cao Xiaohao Xu Chen Sun Y. Cheng Liang Gao Nong Sang 32 1 0 15 Jun 2023
Towards AGI in Computer Vision: Lessons Learned from GPT and Large Language Models Lingxi Xie Longhui Wei Xiaopeng Zhang Kaifeng Bi Xiaotao Gu Jianlong Chang Qi Tian 33 7 0 14 Jun 2023
Learning Domain-Aware Detection Head with Prompt Tuning Haochen Li Rui Zhang Hantao Yao Xinkai Song Yifan Hao Yongwei Zhao Ling Li Yunji Chen VLM 27 14 0 09 Jun 2023
Multi-modal Queried Object Detection in the Wild Yifan Xu Mengdan Zhang Chaoyou Fu Peixian Chen Xiaoshan Yang Ke Li Changsheng Xu ObjD VLM 30 30 0 30 May 2023
Learning without Forgetting for Vision-Language Models Da-Wei Zhou Yuanhan Zhang Jingyi Ning Jingyi Ning De-Chuan Zhan De-Chuan Zhan Ziwei Liu VLM CLL 71 37 0 30 May 2023
Adapting Language-Audio Models as Few-Shot Audio Learners Jinhua Liang Xubo Liu Haohe Liu Huy P Phan Emmanouil Benetos Mark D. Plumbley Wenwu Wang VLM 32 19 0 28 May 2023
Do We Really Need a Large Number of Visual Prompts? Youngeun Kim Yuhang Li Abhishek Moitra Ruokai Yin Priyadarshini Panda VLM VPVLM 40 5 0 26 May 2023
Consistent Optimal Transport with Empirical Conditional Measures Piyushi Manupriya Rachit Keerti Das Sayantan Biswas S. Jagarlapudi OT 32 3 0 25 May 2023
Training on Thin Air: Improve Image Classification with Generated Data Yongchao Zhou Hshmat Sahak Jimmy Ba DiffM 19 43 0 24 May 2023
VIP5: Towards Multimodal Foundation Models for Recommendation Shijie Geng Juntao Tan Shuchang Liu Zuohui Fu Yongfeng Zhang 26 69 0 23 May 2023
CLIP4STR: A Simple Baseline for Scene Text Recognition with Pre-trained Vision-Language Model Shuai Zhao Xiaohan Wang Linchao Zhu Yezhou Yang CLIP VLM 23 25 0 23 May 2023
A Dive into SAM Prior in Image Restoration Zeyu Xiao Jiawang Bai Zhihe Lu Zhiwei Xiong 29 16 0 23 May 2023
Bi-VLGM : Bi-Level Class-Severity-Aware Vision-Language Graph Matching for Text Guided Medical Image Segmentation Wenting Chen Jie Liu Yixuan Yuan VLM 39 3 0 20 May 2023
TreePrompt: Learning to Compose Tree Prompts for Explainable Visual Grounding Chenchi Zhang Jun Xiao Lei Chen Jian Shao Long Chen VLM LRM 26 2 0 19 May 2023
Universal Domain Adaptation from Foundation Models: A Baseline Study Bin Deng Kui Jia VLM 26 6 0 18 May 2023
Segment Any Anomaly without Training via Hybrid Prompt Regularization Yunkang Cao Xiaohao Xu Chen Sun Y. Cheng Zongwei Du Liang Gao Nong Sang VLM 37 70 0 18 May 2023
Prompt-Tuning Decision Transformer with Preference Ranking Shengchao Hu Li Shen Ya-Qin Zhang Dacheng Tao OffRL 26 14 0 16 May 2023
Mobile User Interface Element Detection Via Adaptively Prompt Tuning Zhangxuan Gu Zhuoer Xu Haoxing Chen Jun Lan Changhua Meng Weiqiang Wang 19 4 0 16 May 2023
Visual Information Extraction in the Wild: Practical Dataset and End-to-end Solution Jianfeng Kuang Wei Hua Dingkang Liang Mingkun Yang Deqiang Jiang Bo Ren Xiang Bai 27 39 0 12 May 2023
Adapt and Align to Improve Zero-Shot Sketch-Based Image Retrieval Shiyin Dong Mingrui Zhu N. Wang Xinbo Gao VLM 27 3 0 09 May 2023
COLA: A Benchmark for Compositional Text-to-image Retrieval Arijit Ray Filip Radenovic Abhimanyu Dubey Bryan A. Plummer Ranjay Krishna Kate Saenko CoGe VLM 41 34 0 05 May 2023
Making the Most of What You Have: Adapting Pre-trained Visual Language Models in the Low-data Regime Chuhan Zhang Antoine Miech Jiajun Shen Jean-Baptiste Alayrac Pauline Luc VLM VPVLM 39 2 0 03 May 2023
VPGTrans: Transfer Visual Prompt Generator across LLMs Ao Zhang Hao Fei Yuan Yao Wei Ji Li Li Zhiyuan Liu Tat-Seng Chua MLLM VLM 27 85 0 02 May 2023