Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model

28 March 2022

Papers citing "Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model"

50 / 244 papers shown

Title
Test-time Distribution Learning Adapter for Cross-modal Visual Reasoning Yi Zhang Ce Zhang VLM 28 1 0 10 Mar 2024
Exploring Robust Features for Few-Shot Object Detection in Satellite Imagery Xavier Bou Gabriele Facciolo R. G. V. Gioi Jean-Michel Morel T. Ehret ObjD 41 2 0 08 Mar 2024
Self-Adapting Large Visual-Language Models to Edge Devices across Visual Modalities Kaiwen Cai Zhekai Duan Gaowen Liu Charles Fleming Chris Xiaoxuan Lu VLM 30 4 0 07 Mar 2024
Controllable Prompt Tuning For Balancing Group Distributional Robustness Hoang Phan Andrew Gordon Wilson Qi Lei 43 5 0 05 Mar 2024
InstaGen: Enhancing Object Detection by Training on Synthetic Dataset Chengjian Feng Yujie Zhong Zequn Jie Weidi Xie Lin Ma ObjD 38 13 0 08 Feb 2024
LLMs Meet VLMs: Boost Open Vocabulary Object Detection with Fine-grained Descriptors Sheng Jin Xue-Qiu Jiang Jiaxing Huang Lewei Lu Shijian Lu VLM ObjD 31 21 0 07 Feb 2024
YOLO-World: Real-Time Open-Vocabulary Object Detection Tianheng Cheng Lin Song Yixiao Ge Wenyu Liu Xinggang Wang Ying Shan VLM ObjD 38 249 0 30 Jan 2024
Towards Lifelong Scene Graph Generation with Knowledge-ware In-context Prompt Learning Tao He Tongtong Wu Dongyang Zhang Guiduo Duan Ke Qin Yuan-Fang Li CLL 29 1 0 26 Jan 2024
Learning to Prompt with Text Only Supervision for Vision-Language Models Muhammad Uzair Khattak Muhammad Ferjad Naeem Muzammal Naseer Luc Van Gool F. Tombari VLM VPVLM 33 19 0 04 Jan 2024
3D Open-Vocabulary Panoptic Segmentation with 2D-3D Vision-Language Distillation Zihao Xiao Longlong Jing Shangxuan Wu Alex Zihao Zhu Jingwei Ji ... Thomas Funkhouser Weicheng Kuo A. Angelova Yin Zhou Shiwei Sheng VLM 33 5 0 04 Jan 2024
Query-Based Knowledge Sharing for Open-Vocabulary Multi-Label Classification Xueling Zhu Jian Liu Dongqi Tang Jiawei Ge Weijia Liu Bo Liu Jiuxin Cao VLM 27 1 0 02 Jan 2024
Leveraging Open-Vocabulary Diffusion to Camouflaged Instance Segmentation Tuan-Anh Vu Duc Thanh Nguyen Qing-Wu Guo Binh-Son Hua N. Chung Ivor W. Tsang Sai-Kit Yeung DiffM 37 3 0 29 Dec 2023
Revisiting Few-Shot Object Detection with Vision-Language Models Anish Madan Neehar Peri Shu Kong Deva Ramanan VLM 32 6 0 22 Dec 2023
CLIM: Contrastive Language-Image Mosaic for Region Representation Size Wu Wenwei Zhang Lumin Xu Sheng Jin Wentao Liu Chen Change Loy ObjD VLM 52 15 0 18 Dec 2023
Simple Image-level Classification Improves Open-vocabulary Object Detection Ru Fang Guansong Pang Xiaolong Bai ObjD VLM 53 14 0 16 Dec 2023
3DAxiesPrompts: Unleashing the 3D Spatial Task Capabilities of GPT-4V Dingning Liu Xiaomeng Dong Renrui Zhang Xu Luo Peng Gao Xiaoshui Huang Yongshun Gong Zhihui Wang 34 10 0 15 Dec 2023
ProxyDet: Synthesizing Proxy Novel Classes via Classwise Mixup for Open-Vocabulary Object Detection Joonhyun Jeong Geondo Park Jayeon Yoo Hyungsik Jung Heesu Kim VLM ObjD 41 10 0 12 Dec 2023
Domain Prompt Learning with Quaternion Networks Qinglong Cao Zhengqin Xu Yuntian Chen Chao Ma Xiaokang Yang VLM 39 10 0 12 Dec 2023
Object Recognition as Next Token Prediction Kaiyu Yue Borchun Chen Jonas Geiping Hengduo Li Tom Goldstein Ser-Nam Lim 40 9 0 04 Dec 2023
Behind the Magic, MERLIM: Multi-modal Evaluation Benchmark for Large Image-Language Models Andrés Villa Juan Carlos León Alcázar Alvaro Soto Bernard Ghanem MLLM VLM 24 9 0 03 Dec 2023
Language-conditioned Detection Transformer Jang Hyun Cho Philipp Krahenbuhl VLM ObjD 47 1 0 29 Nov 2023
The devil is in the fine-grained details: Evaluating open-vocabulary object detectors for fine-grained understanding Lorenzo Bianchi F. Carrara Nicola Messina Claudio Gennaro Fabrizio Falchi ObjD 27 13 0 29 Nov 2023
Hardware Resilience Properties of Text-Guided Image Classifiers Syed Talal Wasim Kabila Haile Soboka Abdulrahman Mahmoud Salman Khan David Brooks Gu-Yeon Wei VLM 22 1 0 23 Nov 2023
Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning Yan Li Weiwei Guo Xue Yang Ning Liao Dunyun He Jiaqi Zhou Wenxian Yu ObjD VLM 32 7 0 20 Nov 2023
Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention Zuyao Chen Jinlin Wu Zhen Lei Zhaoxiang Zhang Changwen Chen 25 11 0 18 Nov 2023
TENT: Connect Language Models with IoT Sensors for Zero-Shot Activity Recognition Yunjiao Zhou Jianfei Yang Han Zou Lihua Xie VLM 29 17 0 14 Nov 2023
Meta-Adapter: An Online Few-shot Learner for Vision-Language Model Cheng Cheng Lin Song Ruoyi Xue Hang Wang Hongbin Sun Yixiao Ge Ying Shan VLM ObjD 39 18 0 07 Nov 2023
Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion Hao Zhou Tiancheng Shen Xu Yang Hai Huang Xiangtai Li Lu Qi Ming-Hsuan Yang 89 12 0 06 Nov 2023
Recognize Any Regions Haosen Yang Chuofan Ma Bin Wen Yi-Xin Jiang Zehuan Yuan Xiatian Zhu ObjD VLM 48 6 0 02 Nov 2023
Text Augmented Spatial-aware Zero-shot Referring Image Segmentation Yuchen Suo Linchao Zhu Yi Yang 31 13 0 27 Oct 2023
LP-OVOD: Open-Vocabulary Object Detection by Linear Probing Chau Pham Truong Vu Khoi Duc Minh Nguyen ObjD 22 16 0 26 Oct 2023
CoDet: Co-Occurrence Guided Region-Word Alignment for Open-Vocabulary Object Detection Chuofan Ma Yi-Xin Jiang Xin Wen Zehuan Yuan Xiaojuan Qi ObjD VLM 28 48 0 25 Oct 2023
On the Powerfulness of Textual Outlier Exposure for Visual OoD Detection Sangha Park J. Mok Dahuin Jung Saehyung Lee Sung-Hoon Yoon 22 10 0 25 Oct 2023
OV-VG: A Benchmark for Open-Vocabulary Visual Grounding Chunlei Wang Wenquan Feng Xiangtai Li Guangliang Cheng Shuchang Lyu Binghao Liu Lijiang Chen Qi Zhao ObjD VLM 26 9 0 22 Oct 2023
Interactive Navigation in Environments with Traversable Obstacles Using Large Language and Vision-Language Models Zhen Zhang Anran Lin Chun Wai Wong X. Chu Qi Dou K. W. S. Au LM&Ro 30 7 0 13 Oct 2023
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection Yang Cao Yihan Zeng Hang Xu Dan Xu 3DPC ObjD 24 33 0 04 Oct 2023
CLIPSelf: Vision Transformer Distills Itself for Open-Vocabulary Dense Prediction Size Wu Wenwei Zhang Lumin Xu Sheng Jin Xiangtai Li Wentao Liu Chen Change Loy CLIP VLM 24 69 0 02 Oct 2023
DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection Shilin Xu Xiangtai Li Size Wu Wenwei Zhang Yunhai Tong Chen Change Loy ObjD VLM 31 0 0 02 Oct 2023
Region-centric Image-Language Pretraining for Open-Vocabulary Detection Dahun Kim A. Angelova Weicheng Kuo ObjD VLM 17 3 0 29 Sep 2023
PEACE: Prompt Engineering Automation for CLIPSeg Enhancement in Aerial Robotics Haechan Mark Bong Rongge Zhang Ricardo de Azambuja Giovanni Beltrame 19 2 0 29 Sep 2023
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation Jiahao Xie Wei Li Xiangtai Li Ziwei Liu Yew-Soon Ong Chen Change Loy DiffM VLM 69 35 0 22 Sep 2023
Unsupervised Open-Vocabulary Object Localization in Videos Ke Fan Zechen Bai Tianjun Xiao Dominik Zietlow Max Horn ... Bernt Schiele Thomas Brox Zheng-Wei Zhang Yanwei Fu Tong He 53 9 0 18 Sep 2023
Efficient Emotional Adaptation for Audio-Driven Talking-Head Generation Yuan Gan Zongxin Yang Xihang Yue Lingyun Sun Yezhou Yang 25 57 0 10 Sep 2023
Distribution-Aware Prompt Tuning for Vision-Language Models Eulrang Cho Jooyeon Kim Hyunwoo J. Kim VPVLM VLM 32 20 0 06 Sep 2023
BDC-Adapter: Brownian Distance Covariance for Better Vision-Language Reasoning Yi Zhang Ce Zhang Zihan Liao Yushun Tang Zhihai He BDL VLM 26 10 0 03 Sep 2023
EdaDet: Open-Vocabulary Object Detection Using Early Dense Alignment Cheng Shi Sibei Yang VLM ObjD 38 38 0 03 Sep 2023
Contrastive Feature Masking Open-Vocabulary Vision Transformer Dahun Kim A. Angelova Weicheng Kuo ObjD VLM 23 27 0 02 Sep 2023
What Makes Good Open-Vocabulary Detector: A Disassembling Perspective Jincheng Li Chunyu Xie Xiaoyu Wu Bin Wang Dawei Leng VLM ObjD 17 3 0 01 Sep 2023
Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object Detection Yifan Xu Mengdan Zhang Xiaoshan Yang Changsheng Xu ObjD 32 5 0 30 Aug 2023
Unsupervised Prototype Adapter for Vision-Language Models Yi Zhang Ce Zhang Xue-mei Hu Z. He VLM 29 4 0 22 Aug 2023