Multimodal Prompting with Missing Modalities for Visual Recognition

Multimodal Prompting with Missing Modalities for Visual Recognition

6 March 2023

Chen-Yu Lee

Papers citing "Multimodal Prompting with Missing Modalities for Visual Recognition"

13 / 63 papers shown

Title
Zero-Shot and Few-Shot Video Question Answering with Multi-Modal Prompts Bipin Rajendran Bashir M. Al-Hashimi MLLM VLM 32 2 0 27 Sep 2023
A Survey on Image-text Multimodal Models Ruifeng Guo Jingxuan Wei Linzhuang Sun Khai Le-Duc Guiyong Chang Dawei Liu Sibo Zhang Zhengbing Yao Mingjun Xu Liping Bu VLM 31 5 0 23 Sep 2023
Delving into Multimodal Prompting for Fine-grained Visual Classification Xin Jiang Hao Tang Junyao Gao Xiaoyu Du Shengfeng He Zechao Li VLM 29 23 0 16 Sep 2023
Visual Prompt Flexible-Modal Face Anti-Spoofing Zitong Yu Rizhao Cai Yawen Cui Ajian Liu Changsheng Chen 38 6 0 26 Jul 2023
ChatGPT-Like Large-Scale Foundation Models for Prognostics and Health Management: A Survey and Roadmaps Yanfang Li Huan Wang Muxia Sun LM&MA AI4TS AI4CE 29 46 0 10 May 2023
Towards Unified AI Drug Discovery with Multiple Knowledge Modalities Yi Luo Xing Yi Liu Kai Yang Kui Huang Massimo Hong Jiahuan Zhang Yushuai Wu Zaiqing Nie OffRL 40 4 0 17 Apr 2023
RGBT Tracking via Progressive Fusion Transformer with Dynamically Guided Learning Yabin Zhu Chenglong Li Tianlin Li Jin Tang Zhixiang Huang 40 7 0 26 Mar 2023
What Language Model to Train if You Have One Million GPU Hours? Teven Le Scao Thomas Wang Daniel Hesslow Lucile Saulnier Stas Bekman ... Lintang Sutawika Jaesung Tae Zheng-Xin Yong Julien Launay Iz Beltagy MoE AI4CE 230 103 0 27 Oct 2022
MaPLe: Multi-modal Prompt Learning Muhammad Uzair Khattak H. Rasheed Muhammad Maaz Salman Khan Fahad Shahbaz Khan VPVLM VLM 212 532 0 06 Oct 2022
Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions Paul Pu Liang Amir Zadeh Louis-Philippe Morency 18 62 0 07 Sep 2022
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 348 2,271 0 02 Sep 2021
The Power of Scale for Parameter-Efficient Prompt Tuning Brian Lester Rami Al-Rfou Noah Constant VPVLM 280 3,858 0 18 Apr 2021
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 424 596 0 21 Jul 2020