Context-I2W: Mapping Images to Context-dependent Words for Accurate Zero-Shot Composed Image Retrieval

28 September 2023

Qi Wu

Papers citing "Context-I2W: Mapping Images to Context-dependent Words for Accurate Zero-Shot Composed Image Retrieval"

24 / 24 papers shown

Title
From Mapping to Composing: A Two-Stage Framework for Zero-shot Composed Image Retrieval Yabing Wang Zhuotao Tian Qingpei Guo Zheng Qin Sanping Zhou Ming Yang Le Wang 186 0 0 25 Apr 2025
Missing Target-Relevant Information Prediction with World Model for Accurate Zero-Shot Composed Image Retrieval Yuanmin Tang Jing Yu Keke Gai Jiamin Zhuang Gang Xiong Gaopeng Gou Qi Wu VGen 56 1 0 21 Mar 2025
Data-Efficient Generalization for Zero-shot Composed Image Retrieval Zining Chen Zhaohui Hou Zhicheng Zhao Xiaoqin Zhang Shijian Lu VLM 50 0 0 07 Mar 2025
Composed Multi-modal Retrieval: A Survey of Approaches and Applications Kun Zhang Jingyu Li Zhiyu Li Jingjing Zhang 43 0 0 03 Mar 2025
A Comprehensive Survey on Composed Image Retrieval Xuemeng Song Haoqiang Lin Haokun Wen Bohan Hou Mingzhu Xu Liqiang Nie 55 1 0 19 Feb 2025
SCOT: Self-Supervised Contrastive Pretraining For Zero-Shot Compositional Retrieval Bhavin Jawade JOÃO-BRUNO Soares K. Thadani D. Mohan Amir Erfan Eshratifar Benjamin Culpepper Paloma de Juan S. Setlur V. Govindaraju 45 0 0 12 Jan 2025
Reason-before-Retrieve: One-Stage Reflective Chain-of-Thoughts for Training-Free Zero-Shot Composed Image Retrieval Yuanmin Tang Xiaoting Qin Jingyang Zhang Jing Yu Gaopeng Gou Gang Xiong Qingwei Ling Saravan Rajmohan Dongmei Zhang Qi Wu LRM 68 1 0 15 Dec 2024
Composed Image Retrieval for Training-Free Domain Conversion Nikos Efthymiadis Bill Psomas Zakaria Laskar Konstantinos Karantzalos Yannis Avrithis Ondřej Chum Giorgos Tolias 83 0 0 04 Dec 2024
MoTaDual: Modality-Task Dual Alignment for Enhanced Zero-shot Composed Image Retrieval Haiwen Li Zhicheng Zhao Zhaohui Hou 33 0 0 31 Oct 2024
CLIP-SCGI: Synthesized Caption-Guided Inversion for Person Re-Identification Qianru Han Xinwei He Zhi Liu Sannyuya Liu Ying Zhang Jinhai Xiang 21 1 0 12 Oct 2024
EgoCVR: An Egocentric Benchmark for Fine-Grained Composed Video Retrieval Thomas Hummel Shyamgopal Karthik Mariana-Iuliana Georgescu Zeynep Akata EgoV 36 4 0 23 Jul 2024
E5-V: Universal Embeddings with Multimodal Large Language Models Ting Jiang Minghui Song Zihan Zhang Haizhen Huang Weiwei Deng Feng Sun Qi Zhang Deqing Wang Fuzhen Zhuang VLM 33 22 0 17 Jul 2024
Pseudo-triplet Guided Few-shot Composed Image Retrieval Bohan Hou Haoqiang Lin Haokun Wen Meng Liu Xuemeng Song 41 4 0 08 Jul 2024
HyCIR: Boosting Zero-Shot Composed Image Retrieval with Synthetic Labels Yingying Jiang Hanchao Jia Xiaobing Wang Peng Hao VLM 39 4 0 08 Jul 2024
iSEARLE: Improving Textual Inversion for Zero-Shot Composed Image Retrieval Lorenzo Agnolucci Alberto Baldrati Marco Bertini A. Bimbo 40 10 0 05 May 2024
MagicLens: Self-Supervised Image Retrieval with Open-Ended Instructions Kai Zhang Yi Luan Hexiang Hu Kenton Lee Siyuan Qiao Wenhu Chen Yu-Chuan Su Ming-Wei Chang VLM LRM 41 34 0 28 Mar 2024
Learning Commonality, Divergence and Variety for Unsupervised Visible-Infrared Person Re-identification Jiangming Shi Xiangbo Yin Yaoxing Wang Xiaofeng Liu Yuan Xie Yanyun Qu 60 8 0 29 Feb 2024
Multi-Memory Matching for Unsupervised Visible-Infrared Person Re-Identification Jiangming Shi Xiangbo Yin Yeyun Chen Yachao Zhang Zhizhong Zhang Yuan Xie Yanyun Qu 26 18 0 12 Jan 2024
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data Jiangming Shi Shanshan Zheng Xiangbo Yin Yang Lu Yuan Xie Yanyun Qu VLM FedML 52 10 0 14 Dec 2023
Pretrain like Your Inference: Masked Tuning Improves Zero-Shot Composed Image Retrieval Junyang Chen Hanjiang Lai VLM 45 15 0 13 Nov 2023
Watermarking Vision-Language Pre-trained Models for Multi-modal Embedding as a Service Yuanmin Tang Jing Yu Keke Gai Xiangyang Qu Yue Hu Gang Xiong Qi Wu AAML WaLM VLM 32 7 0 10 Nov 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 320 4,279 0 30 Jan 2023
Visualize Before You Write: Imagination-Guided Open-Ended Text Generation Wanrong Zhu An Yan Yujie Lu Wenda Xu Junfeng Fang Miguel P. Eckstein William Yang Wang 82 37 0 07 Oct 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 392 4,171 0 28 Jan 2022