Unified Loss of Pair Similarity Optimization for Vision-Language
Retrieval

Unified Loss of Pair Similarity Optimization for Vision-Language Retrieval

28 September 2022

Caili Guo

Papers citing "Unified Loss of Pair Similarity Optimization for Vision-Language Retrieval"

11 / 11 papers shown

Title
Bridging Video-text Retrieval with Multiple Choice Questions Yuying Ge Yixiao Ge Xihui Liu Dian Li Ying Shan Xiaohu Qie Ping Luo BDL 50 108 0 13 Jan 2022
Everything at Once -- Multi-modal Fusion Transformer for Video Retrieval Nina Shvetsova Brian Chen Andrew Rouditchenko Samuel Thomas Brian Kingsbury Rogerio Feris David Harwath James R. Glass Hilde Kuehne ViT 60 130 0 08 Dec 2021
Object-aware Video-language Pre-training for Retrieval Alex Jinpeng Wang Yixiao Ge Guanyu Cai Rui Yan Xudong Lin Ying Shan Xiaohu Qie Mike Zheng Shou ViT VLM 48 80 0 01 Dec 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 392 3,778 0 11 Feb 2021
Similarity Reasoning and Filtration for Image-Text Matching Haiwen Diao Ying Zhang Lingyun Ma Huchuan Lu 257 333 0 05 Jan 2021
Multi-modal Transformer for Video Retrieval Valentin Gabeur Chen Sun Alahari Karteek Cordelia Schmid ViT 504 602 0 21 Jul 2020
IMRAM: Iterative Matching with Recurrent Attention Memory for Cross-Modal Image-Text Retrieval Hui Chen Guiguang Ding Xudong Liu Zijia Lin Ji Liu Jungong Han 45 319 0 08 Mar 2020
Circle Loss: A Unified Perspective of Pair Similarity Optimization Yifan Sun Changmao Cheng Yuhan Zhang Chi Zhang Liang Zheng Zhongdao Wang Yichen Wei 70 856 0 25 Feb 2020
Expressing Objects just like Words: Recurrent Visual Embedding for Image-Text Matching Tianlang Chen Jiebo Luo 25 69 0 20 Feb 2020
Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering Peter Anderson Xiaodong He Chris Buehler Damien Teney Mark Johnson Stephen Gould Lei Zhang AIMat 102 4,201 0 25 Jul 2017
FaceNet: A Unified Embedding for Face Recognition and Clustering Florian Schroff Dmitry Kalenichenko James Philbin 3DH 281 13,079 0 12 Mar 2015