VL-Taboo: An Analysis of Attribute-based Zero-shot Capabilities of
Vision-Language Models

VL-Taboo: An Analysis of Attribute-based Zero-shot Capabilities of Vision-Language Models

12 September 2022

Leonid Karlinsky

Papers citing "VL-Taboo: An Analysis of Attribute-based Zero-shot Capabilities of Vision-Language Models"

16 / 16 papers shown

Title
WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models Yonatan Bitton Nitzan Bitton-Guetta Ron Yosef Yuval Elovici Joey Tianyi Zhou Gabriel Stanovsky Roy Schwartz 34 19 0 25 Jul 2022
VL-CheckList: Evaluating Pre-trained Vision-Language Models with Objects, Attributes and Relations Tiancheng Zhao Tianqi Zhang Mingwei Zhu Haozhan Shen Kyusong Lee Xiaopeng Lu Jianwei Yin VLM CoGe MLLM 78 93 0 01 Jul 2022
MSDN: Mutually Semantic Distillation Network for Zero-Shot Learning Shiming Chen Ziming Hong Guosen Xie Wenhan Wang Qinmu Peng Kai Wang Jian-jun Zhao Xinge You VLM 49 102 0 07 Mar 2022
FLAVA: A Foundational Language And Vision Alignment Model Amanpreet Singh Ronghang Hu Vedanuj Goswami Guillaume Couairon Wojciech Galuba Marcus Rohrbach Douwe Kiela CLIP VLM 56 695 0 08 Dec 2021
Prompting Visual-Language Models for Efficient Video Understanding Chen Ju Tengda Han Kunhao Zheng Ya Zhang Weidi Xie VPVLM VLM 49 371 0 08 Dec 2021
FILIP: Fine-grained Interactive Language-Image Pre-Training Lewei Yao Runhu Huang Lu Hou Guansong Lu Minzhe Niu Hang Xu Xiaodan Liang Zhenguo Li Xin Jiang Chunjing Xu VLM CLIP 57 627 0 09 Nov 2021
LAION-400M: Open Dataset of CLIP-Filtered 400 Million Image-Text Pairs Christoph Schuhmann Richard Vencu Romain Beaumont R. Kaczmarczyk Clayton Mullis Aarush Katta Theo Coombes J. Jitsev Aran Komatsuzaki VLM MLLM CLIP 168 1,398 0 03 Nov 2021
SimVLM: Simple Visual Language Model Pretraining with Weak Supervision Zirui Wang Jiahui Yu Adams Wei Yu Zihang Dai Yulia Tsvetkov Yuan Cao VLM MLLM 95 789 0 24 Aug 2021
Probing Image-Language Transformers for Verb Understanding Lisa Anne Hendricks Aida Nematzadeh 51 116 0 16 Jun 2021
Zero-Shot Text-to-Image Generation Aditya A. Ramesh Mikhail Pavlov Gabriel Goh Scott Gray Chelsea Voss Alec Radford Mark Chen Ilya Sutskever VLM 311 4,873 0 24 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 383 3,778 0 11 Feb 2021
Oscar: Object-Semantics Aligned Pre-training for Vision-Language Tasks Xiujun Li Xi Yin Chunyuan Li Pengchuan Zhang Xiaowei Hu ... Houdong Hu Li Dong Furu Wei Yejin Choi Jianfeng Gao VLM 62 1,927 0 13 Apr 2020
UNITER: UNiversal Image-TExt Representation Learning Yen-Chun Chen Linjie Li Licheng Yu Ahmed El Kholy Faisal Ahmed Zhe Gan Yu Cheng Jingjing Liu VLM OT 65 447 0 25 Sep 2019
VisualBERT: A Simple and Performant Baseline for Vision and Language Liunian Harold Li Mark Yatskar Da Yin Cho-Jui Hsieh Kai-Wei Chang VLM 100 1,939 0 09 Aug 2019
Zero-Shot Learning -- A Comprehensive Evaluation of the Good, the Bad and the Ugly Yongqin Xian Christoph H. Lampert Bernt Schiele Zeynep Akata VLM 116 1,554 0 03 Jul 2017
Neural Machine Translation of Rare Words with Subword Units Rico Sennrich Barry Haddow Alexandra Birch 149 7,683 0 31 Aug 2015