Unified Visual Relationship Detection with Vision and Language Models

Unified Visual Relationship Detection with Vision and Language Models

16 March 2023

Florian Schroff

Papers citing "Unified Visual Relationship Detection with Vision and Language Models"

19 / 19 papers shown

Title
Dynamic Relation Inference via Verb Embeddings Omri Suissa Muhiim Ali Ariana Azarbal Hui Shen Shekhar Pradhan 46 0 0 17 Mar 2025
End-to-end Open-vocabulary Video Visual Relationship Detection using Multi-modal Prompting Yongqi Wang Xinxiao Wu Shuo Yang Jiebo Luo 134 1 0 19 Sep 2024
Hydra-SGG: Hybrid Relation Assignment for One-stage Scene Graph Generation Minghan Chen Guikun Chen Wenguan Wang Yi Yang 56 3 0 16 Sep 2024
ViRED: Prediction of Visual Relations in Engineering Drawings Chao Gu Ke Lin Yiyang Luo Jiahui Hou Xiang-Yang Li 35 0 0 02 Sep 2024
Towards Flexible Visual Relationship Segmentation Fangrui Zhu Jianwei Yang Huaizu Jiang VOS 34 1 0 15 Aug 2024
Open-World Human-Object Interaction Detection via Multi-modal Prompts Jie-jin Yang Bingliang Li Ailing Zeng L. Zhang Ruimao Zhang VLM 32 8 0 11 Jun 2024
Scene-Graph ViT: End-to-End Open-Vocabulary Visual Relationship Detection Tim Salzmann Markus Ryll Alex Bewley Matthias Minderer 53 4 0 21 Mar 2024
RLIPv2: Fast Scaling of Relational Language-Image Pre-training Hangjie Yuan Shiwei Zhang Xiang Wang Samuel Albanie Yining Pan Tao Feng Jianwen Jiang Dong Ni Yingya Zhang Deli Zhao VLM 21 38 0 18 Aug 2023
Towards Hard-Positive Query Mining for DETR-based Human-Object Interaction Detection Xubin Zhong Changxing Ding Zijian Li Shaoli Huang 37 23 0 12 Jul 2022
RelTR: Relation Transformer for Scene Graph Generation Yuren Cong M. Yang Bodo Rosenhahn ViT 97 133 0 27 Jan 2022
SCENIC: A JAX Library for Computer Vision Research and Beyond Mostafa Dehghani A. Gritsenko Anurag Arnab Matthias Minderer Yi Tay 46 68 0 18 Oct 2021
CPT: Colorful Prompt Tuning for Pre-trained Vision-Language Models Yuan Yao Ao Zhang Zhengyan Zhang Zhiyuan Liu Tat-Seng Chua Maosong Sun MLLM VPVLM VLM 208 221 0 24 Sep 2021
Open-vocabulary Object Detection via Vision and Language Knowledge Distillation Xiuye Gu Nayeon Lee Weicheng Kuo Huayu Chen VLM ObjD 225 898 0 28 Apr 2021
Bipartite Graph Network with Adaptive Message Passing for Unbiased Scene Graph Generation Rongjie Li Songyang Zhang Bo Wan Xuming He 185 214 0 01 Apr 2021
Simple multi-dataset detection Xingyi Zhou V. Koltun Philipp Krahenbuhl ObjD 236 112 0 25 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 301 3,700 0 11 Feb 2021
VSGNet: Spatial Attention Network for Detecting Human Object Interactions Using Graph Convolutions Oytun Ulutan A S M Iftekhar B. S. Manjunath 66 186 0 11 Mar 2020
PPDM: Parallel Point Detection and Matching for Real-time Human-Object Interaction Detection Yue Liao Si Liu Fei-Yue Wang Yanjie Chen Chen Qian Jiashi Feng 71 264 0 30 Dec 2019
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 245 31,257 0 16 Jan 2013