I2MVFormer: Large Language Model Generated Multi-View Document
Supervision for Zero-Shot Image Classification

I2MVFormer: Large Language Model Generated Multi-View Document Supervision for Zero-Shot Image Classification

5 December 2022

Muhammad Ferjad Naeem

Muhammad Gul Zain Ali Khan

Muhammad Zeshan Afzal

Luc Van Gool

Papers citing "I2MVFormer: Large Language Model Generated Multi-View Document Supervision for Zero-Shot Image Classification"

14 / 14 papers shown

Title
VR-RAG: Open-vocabulary Species Recognition with RAG-Assisted Large Multi-Modal Models F. Khan Jun Chen Youssef Mohamed Chun-Mei Feng Mohamed Elhoseiny VLM 33 0 0 08 May 2025
Interpretable Zero-shot Learning with Infinite Class Concepts Zihan Ye Shreyank N Gowda Shiming Chen Yaochu Jin Kaizhu Huang Xiaobo Jin VLM 37 0 0 06 May 2025
ProAPO: Progressively Automatic Prompt Optimization for Visual Classification Xiangyan Qu Gaopeng Gou Jiamin Zhuang Jing Yu Kun Song Qihao Wang Yili Li Gang Xiong VLM 91 0 0 13 Mar 2025
Cross-Modal Attention Alignment Network with Auxiliary Text Description for zero-shot sketch-based image retrieval Hanwen Su G. Song K. Huang Jiyan Wang Ming Yang 48 1 0 01 Jul 2024
Context-Enhanced Video Moment Retrieval with Large Language Models Weijia Liu Bo Miao Jiuxin Cao Xueling Zhu Bo Liu Mehwish Nasim Ajmal Saeed Mian 29 2 0 21 May 2024
ECOR: Explainable CLIP for Object Recognition Ali Rasekh Sepehr Kazemi Ranjbar Milad Heidari Wolfgang Nejdl VLM 46 4 0 19 Apr 2024
Exploring the Potential of Large Foundation Models for Open-Vocabulary HOI Detection Ting Lei Shaofeng Yin Yang Liu VLM 47 9 0 09 Apr 2024
LLMBind: A Unified Modality-Task Integration Framework Bin Zhu Munan Ning Peng Jin Bin Lin Jinfa Huang ... Junwu Zhang Zhenyu Tang Mingjun Pan Xing Zhou Li-ming Yuan MLLM 32 6 0 22 Feb 2024
A Survey on Open-Set Image Recognition Jiaying Sun Qiulei Dong BDL ObjD 32 3 0 25 Dec 2023
SILC: Improving Vision Language Pretraining with Self-Distillation Muhammad Ferjad Naeem Yongqin Xian Xiaohua Zhai Lukas Hoyer Luc Van Gool F. Tombari VLM 25 33 0 20 Oct 2023
Learning to Prompt for Vision-Language Models Kaiyang Zhou Jingkang Yang Chen Change Loy Ziwei Liu VPVLM CLIP VLM 330 2,267 0 02 Sep 2021
Learning Graph Embeddings for Open World Compositional Zero-Shot Learning Massimiliano Mancini Muhammad Ferjad Naeem Yongqin Xian Zeynep Akata CoGe 69 67 0 03 May 2021
Revisiting Document Representations for Large-Scale Zero-Shot Learning Jihyung Kil Wei-Lun Chao VLM 40 10 0 21 Apr 2021
Retrieving and Reading: A Comprehensive Survey on Open-domain Question Answering Fengbin Zhu Wenqiang Lei Chao Wang Jianming Zheng Soujanya Poria Tat-Seng Chua RALM 213 251 0 04 Jan 2021