Learning Object-Language Alignments for Open-Vocabulary Object Detection

27 November 2022

Jianfei Cai

Papers citing "Learning Object-Language Alignments for Open-Vocabulary Object Detection"

50 / 73 papers shown

Title
FG-CLIP: Fine-Grained Visual and Textual Alignment Chunyu Xie Bin Wang Fanjing Kong Jincheng Li Dawei Liang Gengshen Zhang Dawei Leng Yuhui Yin CLIP VLM 46 0 0 08 May 2025
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation Yongchao Feng Yajie Liu Shuai Yang Wenrui Cai J. Zhang ... Jiahui Lv Z. Liu Tengyuan Shi Qingjie Liu Y. Wang MLLM VLM 63 1 0 13 Apr 2025
Refining CLIP's Spatial Awareness: A Visual-Centric Perspective Congpei Qiu Yanhao Wu Wei Ke Xiuxiu Bai Tong Zhang VLM 52 0 0 03 Apr 2025
Bridge the Gap Between Visual and Linguistic Comprehension for Generalized Zero-shot Semantic Segmentation Xiaoqing Guo W. J. Li Yixuan Yuan 55 0 0 31 Mar 2025
A Hierarchical Semantic Distillation Framework for Open-Vocabulary Object Detection Shenghao Fu Junkai Yan Q. Yang Xihan Wei Xiaohua Xie Wei-Shi Zheng ObjD VLM 43 0 0 13 Mar 2025
OVTR: End-to-End Open-Vocabulary Multiple Object Tracking with Transformer Jinyang Li En Yu Sijia Chen Wenbing Tao 52 1 0 13 Mar 2025
Fractional Correspondence Framework in Detection Transformer Masoumeh Zareapoor Pourya Shamsolmoali Huiyu Zhou Yue Lu Salvador García 52 0 0 06 Mar 2025
Grad-ECLIP: Gradient-based Visual and Textual Explanations for CLIP Chenyang Zhao Kun Wang J. H. Hsiao Antoni B. Chan CLIP 68 0 0 26 Feb 2025
Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection Wentao Bao K. Li Yuxiao Chen Deep Patel Martin Renqiang Min Yu Kong VLM ObjD 42 2 0 17 Nov 2024
Frozen-DETR: Enhancing DETR with Image Understanding from Frozen Foundation Models Shenghao Fu Junkai Yan Q. Yang Xihan Wei Xiaohua Xie Wei-Shi Zheng VLM 25 3 0 25 Oct 2024
OVT-B: A New Large-Scale Benchmark for Open-Vocabulary Multi-Object Tracking Haiji Liang Ruize Han VLM 27 1 0 23 Oct 2024
AttriPrompter: Auto-Prompting with Attribute Semantics for Zero-shot Nuclei Detection via Visual-Language Pre-trained Models Yongjian Wu Yang Zhou Jiya Saiyin Bingzheng Wei M. Lai Jianzhong Shou Yan Xu VLM MedIm 25 1 0 22 Oct 2024
Boosting Open-Vocabulary Object Detection by Handling Background Samples Ruizhe Zeng Lu Zhang Xu Yang Zhiyong Liu VLM ObjD 23 0 0 11 Oct 2024
Enhancing Explainability in Multimodal Large Language Models Using Ontological Context Jihen Amara B. König-Ries Sheeba Samuel 19 1 0 27 Sep 2024
Dynamic Object Queries for Transformer-based Incremental Object Detection Jichuan Zhang Wei Li Shuang Cheng Yali Li Shengjin Wang 31 0 0 31 Jul 2024
MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection Kuo Wang Lechao Cheng Weikai Chen Pingping Zhang Liang Lin Fan Zhou Guanbin Li VLM ObjD 29 1 0 31 Jul 2024
PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects Junyi Li Junfeng Wu Weizhi Zhao Song Bai Xiang Bai 36 1 0 23 Jul 2024
OCTrack: Benchmarking the Open-Corpus Multi-Object Tracking Zekun Qian Ruize Han Wei Feng Junhui Hou Linqi Song Song Wang 32 1 0 19 Jul 2024
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models Zijian Zhou Zheng Zhu Holger Caesar Miaojing Shi VLM 31 2 0 15 Jul 2024
PartImageNet++ Dataset: Scaling up Part-based Models for Robust Recognition Xiao-Li Li Yining Liu Na Dong Sitian Qin Xiaolin Hu 36 3 0 15 Jul 2024
Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge Sriram Yenamandra Arun Ramachandran Mukul Khanna Karmesh Yadav Jay Vakil ... Z. Kira Dhruv Batra Roozbeh Mottaghi Yonatan Bisk Chris Paxton LM&Ro 54 6 0 09 Jul 2024
RoboUniView: Visual-Language Model with Unified View Representation for Robotic Manipulaiton Fanfan Liu Feng Yan Liming Zheng Chengjian Feng Yiyang Huang Lin Ma LM&Ro 27 11 0 27 Jun 2024
DiPEx: Dispersing Prompt Expansion for Class-Agnostic Object Detection Jia Syuen Lim Zhuoxiao Chen Mahsa Baktashmotlagh Zhi Chen Xin Yu Zi Huang Yadan Luo VLM ObjD 78 1 0 21 Jun 2024
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection Jiaming Li Jiacheng Zhang Jichang Li Ge Li Si Liu Liang Lin Guanbin Li ObjD VLM 40 13 0 01 Jun 2024
RTGen: Generating Region-Text Pairs for Open-Vocabulary Object Detection Fangyi Chen Han Zhang Zhantao Yang Hao Chen Kai Hu Marios Savvides ObjD VLM 36 5 0 30 May 2024
OV-DQUO: Open-Vocabulary DETR with Denoising Text Query Training and Open-World Unknown Objects Supervision Junjie Wang Bin Chen Bin Kang Yulin Li Yichi Chen Weizhi Xian Huifeng Chang VLM ObjD 23 7 0 28 May 2024
Open-Vocabulary Object Detection via Neighboring Region Attention Alignment Sunyuan Qiang Xianfei Li Yanyan Liang Wenlong Liao Tao He Pai Peng ObjD 27 0 0 14 May 2024
Garbage Segmentation and Attribute Analysis by Robotic Dogs Nuo Xu Jianfeng Liao Qiwei Meng Wei Song 16 0 0 28 Apr 2024
Zero-shot detection of buildings in mobile LiDAR using Language Vision Model June Moh Goo Zichao Zeng Jan Boehm 38 2 0 15 Apr 2024
DetCLIPv3: Towards Versatile Generative Open-vocabulary Object Detection Lewei Yao Renjie Pi Jianhua Han Xiaodan Liang Hang Xu Wei Zhang Zhenguo Li Dan Xu VLM ObjD 50 20 0 14 Apr 2024
Training-free Boost for Open-Vocabulary Object Detection with Confidence Aggregation Yanhao Zheng Kai Liu ObjD 14 1 0 12 Apr 2024
Retrieval-Augmented Open-Vocabulary Object Detection Jooyeon Kim Eulrang Cho Sehyung Kim Hyunwoo J. Kim VLM ObjD 32 8 0 08 Apr 2024
ViTamin: Designing Scalable Vision Models in the Vision-Language Era Jienneg Chen Qihang Yu Xiaohui Shen Alan L. Yuille Liang-Chieh Chen 3DV VLM 30 24 0 02 Apr 2024
AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving Mingfu Liang Jong-Chyi Su S. Schulter Sparsh Garg Shiyu Zhao Ying Nian Wu Manmohan Chandraker VLM 44 14 0 26 Mar 2024
Open-Set Recognition in the Age of Vision-Language Models Dimity Miller Niko Sünderhauf Alex Kenna Keita Mason VLM 32 3 0 25 Mar 2024
Generative Region-Language Pretraining for Open-Ended Object Detection Chuang Lin Yi-Xin Jiang Lizhen Qu Zehuan Yuan Jianfei Cai ObjD VLM 46 13 0 15 Mar 2024
InstaGen: Enhancing Object Detection by Training on Synthetic Dataset Chengjian Feng Yujie Zhong Zequn Jie Weidi Xie Lin Ma ObjD 29 13 0 08 Feb 2024
LLMs Meet VLMs: Boost Open Vocabulary Object Detection with Fine-grained Descriptors Sheng Jin Xue-Qiu Jiang Jiaxing Huang Lewei Lu Shijian Lu VLM ObjD 24 21 0 07 Feb 2024
YOLO-World: Real-Time Open-Vocabulary Object Detection Tianheng Cheng Lin Song Yixiao Ge Wenyu Liu Xinggang Wang Ying Shan VLM ObjD 16 246 0 30 Jan 2024
Generating Enhanced Negatives for Training Language-Based Object Detectors Shiyu Zhao Long Zhao Vijay Kumar B.G Yumin Suh Dimitris N. Metaxas Manmohan Chandraker S. Schulter ObjD VLM 37 5 0 29 Dec 2023
CLIM: Contrastive Language-Image Mosaic for Region Representation Size Wu Wenwei Zhang Lumin Xu Sheng Jin Wentao Liu Chen Change Loy ObjD VLM 47 15 0 18 Dec 2023
General Object Foundation Model for Images and Videos at Scale Junfeng Wu Yi-Xin Jiang Qihao Liu Zehuan Yuan Xiang Bai Song Bai VOS VLM 30 39 0 14 Dec 2023
ProxyDet: Synthesizing Proxy Novel Classes via Classwise Mixup for Open-Vocabulary Object Detection Joonhyun Jeong Geondo Park Jayeon Yoo Hyungsik Jung Heesu Kim VLM ObjD 35 10 0 12 Dec 2023
Learning Pseudo-Labeler beyond Noun Concepts for Open-Vocabulary Object Detection Sunghun Kang Junbum Cha Jonghwan Mun Byungseok Roh Chang D. Yoo VLM ObjD 40 1 0 04 Dec 2023
Language-conditioned Detection Transformer Jang Hyun Cho Philipp Krahenbuhl VLM ObjD 42 1 0 29 Nov 2023
Recognize Any Regions Haosen Yang Chuofan Ma Bin Wen Yi-Xin Jiang Zehuan Yuan Xiatian Zhu ObjD VLM 38 3 0 02 Nov 2023
Text Augmented Spatial-aware Zero-shot Referring Image Segmentation Yuchen Suo Linchao Zhu Yi Yang 21 12 0 27 Oct 2023
LP-OVOD: Open-Vocabulary Object Detection by Linear Probing Chau Pham Truong Vu Khoi Duc Minh Nguyen ObjD 22 16 0 26 Oct 2023
CoDet: Co-Occurrence Guided Region-Word Alignment for Open-Vocabulary Object Detection Chuofan Ma Yi-Xin Jiang Xin Wen Zehuan Yuan Xiaojuan Qi ObjD VLM 18 48 0 25 Oct 2023
OV-PARTS: Towards Open-Vocabulary Part Segmentation Meng Wei Xiaoyu Yue Wenwei Zhang Shu Kong Xihui Liu Jiangmiao Pang VLM 21 24 0 08 Oct 2023