Embedding Arithmetic of Multimodal Queries for Image Retrieval

Embedding Arithmetic of Multimodal Queries for Image Retrieval

6 December 2021

Guillaume Couairon

Papers citing "Embedding Arithmetic of Multimodal Queries for Image Retrieval"

17 / 17 papers shown

Title
Position: Restructuring of Categories and Implementation of Guidelines Essential for VLM Adoption in Healthcare Amara Tariq Rimita Lahiri Charles Kahn Imon Banerjee 26 0 0 12 May 2025
Concept Lancet: Image Editing with Compositional Representation Transplant Jinqi Luo Tianjiao Ding Kwan Ho Ryan Chan Hancheng Min Chris Callison-Burch René Vidal DiffM KELM 72 0 0 03 Apr 2025
Craft: Cross-modal Aligned Features Improve Robustness of Prompt Tuning Jingchen Sun Rohan Sharma Vishnu Suresh Lokhande Changyou Chen 41 0 0 22 Jul 2024
Emergent Visual-Semantic Hierarchies in Image-Text Representations Morris Alper Hadar Averbuch-Elor VLM 37 7 0 11 Jul 2024
They're All Doctors: Synthesizing Diverse Counterfactuals to Mitigate Associative Bias Salma Abdel Magid Jui-Hsien Wang Kushal Kafle Hanspeter Pfister 44 1 0 17 Jun 2024
CapS-Adapter: Caption-based MultiModal Adapter in Zero-Shot Classification Qijie Wang Guandu Liu Bin Wang VLM 29 2 0 26 May 2024
Leveraging Large Language Models for Multimodal Search Oriol Barbany Michael Huang Xinliang Zhu Arnab Dhua 31 9 0 24 Apr 2024
Two Effects, One Trigger: On the Modality Gap, Object Bias, and Information Imbalance in Contrastive Vision-Language Models Simon Schrodi David T. Hoffmann Max Argus Volker Fischer Thomas Brox VLM 58 0 0 11 Apr 2024
Cross-modal Retrieval for Knowledge-based Visual Question Answering Paul Lerner Olivier Ferret C. Guinaudeau 33 7 0 11 Jan 2024
A Surrogate-Assisted Extended Generative Adversarial Network for Parameter Optimization in Free-Form Metasurface Design Manna Dai Yang Jiang Fengxia Yang Joyjit Chattoraj Yingzhi Xia Xinxing Xu Weijiang Zhao M. Dao Yong Liu GAN 28 2 0 18 Oct 2023
Candidate Set Re-ranking for Composed Image Retrieval with Dual Multi-modal Encoder Zheyuan Liu Weixuan Sun Damien Teney Stephen Gould 34 16 0 25 May 2023
Data Roaming and Quality Assessment for Composed Image Retrieval Matan Levy Rami Ben-Ari N. Darshan Dani Lischinski 45 23 0 16 Mar 2023
SuS-X: Training-Free Name-Only Transfer of Vision-Language Models Vishaal Udandarao Ankush Gupta Samuel Albanie VLM MLLM 29 103 0 28 Nov 2022
BoMD: Bag of Multi-label Descriptors for Noisy Chest X-ray Classification Yuanhong Chen Fengbei Liu Hu Wang Chong Wang Yu Tian Yuyuan Liu G. Carneiro NoLa 37 8 0 03 Mar 2022
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 301 3,700 0 11 Feb 2021
A Benchmark and Baseline for Language-Driven Image Editing Jing Shi Ning Xu Trung Bui Franck Dernoncourt Zheng Wen Chenliang Xu DiffM 131 30 0 05 Oct 2020
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 242 31,257 0 16 Jan 2013