v1v2 (latest)

Open-Vocabulary DETR with Conditional Matching

22 March 2022

Papers citing "Open-Vocabulary DETR with Conditional Matching"

50 / 158 papers shown

Title
Open World Object Detection: A Survey Yiming Li Yi Wang Wenqian Wang Dan Lin Bingbing Li Kim-Hui Yap ObjD 96 1 0 01 Jul 2025
Cosmos-Drive-Dreams: Scalable Synthetic Driving Data Generation with World Foundation Models Xuanchi Ren Y. Lu Tianshi Cao Ruiyuan Gao S. Huang ... Jun Gao Laura Leal-Taixe Mike Chen Sanja Fidler Huan Ling VGen 80 0 0 10 Jun 2025
DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models Chenbin Pan Wenbin He Zhengzhong Tu Liu Ren LRM VLM 79 0 0 29 May 2025
Open-Det: An Efficient Learning Framework for Open-Ended Detection Guiping Cao Tao Wang Wenjian Huang X. Lan Jianguo Zhang D. Jiang ObjD VLM 28 0 0 27 May 2025
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception Junjie Wang Bin Chen Yulin Li Bin Kang Yulin Chen Zhuotao Tian VLM 104 0 0 07 May 2025
CDFormer: Cross-Domain Few-Shot Object Detection Transformer Against Feature Confusion Boyuan Meng Xinming Zhang Peilin Li Zhe Wu Yiming Li Wenkai Zhao B. Yu Hui-Liang Shen ViT 351 0 0 02 May 2025
VCM: Vision Concept Modeling Based on Implicit Contrastive Learning with Vision-Language Instruction Fine-Tuning Run Luo Renke Shan Longze Chen Ziqiang Liu Lu Wang Min Yang Xiaobo Xia MLLM VLM 262 1 0 28 Apr 2025
Decoupled Global-Local Alignment for Improving Compositional Understanding Xiaoxing Hu Kaicheng Yang Jianmin Wang Haoran Xu Ziyong Feng Yansen Wang VLM 340 0 0 23 Apr 2025
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation Yongchao Feng Yajie Liu Shuai Yang Wenrui Cai Jing Zhang ... Jiahui Lv Ziqiang Liu Tengyuan Shi Qingjie Liu Yansen Wang MLLM VLM 130 2 0 13 Apr 2025
Refining CLIP's Spatial Awareness: A Visual-Centric Perspective Congpei Qiu Yanhao Wu Wei Ke Xiuxiu Bai Tong Zhang VLM 104 0 0 03 Apr 2025
GLRD: Global-Local Collaborative Reason and Debate with PSL for 3D Open-Vocabulary Detection Xingyu Peng Si Liu Chen Gao Yan Bai Beipeng Mu Xiaofei Wang Huaxia Xia 123 0 0 26 Mar 2025
Cyclic Contrastive Knowledge Transfer for Open-Vocabulary Object Detection Chuhan Zhang Chaoyang Zhu Pingcheng Dong Long Chen Dong Zhang ObjD VLM 493 0 0 14 Mar 2025
OVTR: End-to-End Open-Vocabulary Multiple Object Tracking with Transformer Jinyang Li En Yu Sijia Chen Wenbing Tao 168 2 0 13 Mar 2025
A Hierarchical Semantic Distillation Framework for Open-Vocabulary Object Detection Shenghao Fu Junkai Yan Q. Yang Xihan Wei Xiaohua Xie Wei-Shi Zheng ObjD VLM 87 0 0 13 Mar 2025
DitHub: A Modular Framework for Incremental Open-Vocabulary Object Detection Chiara Cappellino Gianluca Mancusi Matteo Mosconi Angelo Porrello Simone Calderara Rita Cucchiara ObjD VLM 189 0 0 12 Mar 2025
Attention to Trajectory: Trajectory-Aware Open-Vocabulary Tracking Yunhao Li Yifan Jiao Dan Meng Heng Fan L. Zhang 101 0 0 11 Mar 2025
YOLOE: Real-Time Seeing Anything Ao Wang Lihao Liu Hui Chen Zijia Lin Jiawei Han Guiguang Ding VLM ObjD 136 6 0 10 Mar 2025
OV-SCAN: Semantically Consistent Alignment for Novel Object Discovery in Open-Vocabulary 3D Object Detection Adrian Chow Evelien Riddell Yimu Wang Sean Sedwards Krzysztof Czarnecki 3DPC 77 0 0 09 Mar 2025
InPK: Infusing Prior Knowledge into Prompt for Vision-Language Models Shuchang Zhou Jiwei Wei Shiyuan He Yuyang Zhou Chaoning Zhang Jie Zou Ning Xie Yang Yang VLM VPVLM 154 0 0 27 Feb 2025
Modulating CNN Features with Pre-Trained ViT Representations for Open-Vocabulary Object Detection Xiangyu Gao Yu Dai Benliu Qiu Hongliang Li Heqian Qiu Hongliang Li ObjD VLM 467 0 0 28 Jan 2025
Enhancing Novel Object Detection via Cooperative Foundational Models Rohit K Bharadwaj Muzammal Naseer Salman Khan Fahad Shahbaz Khan ObjD VLM 350 1 0 17 Jan 2025
Leveraging Content and Context Cues for Low-Light Image Enhancement Igor Morawski Kai He Shusil Dangi Winston H. Hsu 145 2 0 10 Dec 2024
Leverage Task Context for Object Affordance Ranking Haojie Huang Hongchen Luo Wei-dong Zhai Yang Cao Zheng-jun Zha 137 0 0 25 Nov 2024
Exploiting VLM Localizability and Semantics for Open Vocabulary Action Detection Wentao Bao Keqin Li Yuxiao Chen Deep Patel Martin Renqiang Min Yu Kong VLM ObjD 96 2 0 17 Nov 2024
Harnessing Vision Foundation Models for High-Performance, Training-Free Open Vocabulary Segmentation Yuheng Shi Minjing Dong Chang Xu VLM 120 3 0 14 Nov 2024
Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation Yan Li Weiwei Guo Xue Yang Ning Liao Shaofeng Zhang Yi Yu Wenxian Yu Junchi Yan ObjD 71 1 0 04 Nov 2024
ImOV3D: Learning Open-Vocabulary Point Clouds 3D Object Detection from Only 2D Images Timing Yang Yuanliang Ju Li Yi 3DPC 97 4 0 31 Oct 2024
Open-Vocabulary Object Detection via Language Hierarchy Jiaxing Huang Jingyi Zhang Kai Jiang Shijian Lu ObjD VLM 126 1 0 27 Oct 2024
OVT-B: A New Large-Scale Benchmark for Open-Vocabulary Multi-Object Tracking Haiji Liang Ruize Han VLM 105 2 0 23 Oct 2024
LOBG:Less Overfitting for Better Generalization in Vision-Language Model Chenhao Ding Xinyuan Gao Songlin Dong Yuhang He Qiang Wang Alex C. Kot Yihong Gong VLM 71 1 0 14 Oct 2024
Boosting Open-Vocabulary Object Detection by Handling Background Samples Ruizhe Zeng Lu Zhang Xu Yang Zhiyong Liu VLM ObjD 48 0 0 11 Oct 2024
End-to-end Open-vocabulary Video Visual Relationship Detection using Multi-modal Prompting Yongqi Wang Xinxiao Wu Shuo Yang Jiebo Luo 462 1 0 19 Sep 2024
From COCO to COCO-FP: A Deep Dive into Background False Positives for COCO Detectors Longfei Liu Wen Guo Shijie Huang Cheng Li Xi Shen ObjD 95 0 0 12 Sep 2024
More Pictures Say More: Visual Intersection Network for Open Set Object Detection Bingcheng Dong Yuning Ding Jinrong Zhang Sifan Zhang Shenglan Liu ObjD 90 0 0 26 Aug 2024
OpenNav: Efficient Open Vocabulary 3D Object Detection for Smart Wheelchair Navigation Muhammad Rameez Ur Rahman Piero Simonetto Anna Polato Francesco Pasti Luca Tonin Sebastiano Vascon 3DPC 77 0 0 25 Aug 2024
Visual Grounding for Object-Level Generalization in Reinforcement Learning Haobin Jiang Zongqing Lu LM&Ro 91 2 0 04 Aug 2024
Dynamic Object Queries for Transformer-based Incremental Object Detection Jichuan Zhang Wei Li Shuang Cheng Yali Li Shengjin Wang 87 0 0 31 Jul 2024
MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection Kuo Wang Lechao Cheng Weikai Chen Pingping Zhang Liang Lin Fan Zhou Guanbin Li VLM ObjD 76 3 0 31 Jul 2024
Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation Pengfei Wang Yuxi Wang Shuai Li Zhaoxiang Zhang Zhen Lei Lei Zhang 113 3 0 18 Jul 2024
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction Penghui Du Yu Wang Yifan Sun Luting Wang Yue Liao Gang Zhang Errui Ding Yan Wang Jingdong Wang Si Liu VLM ObjD 127 1 0 16 Jul 2024
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models Zijian Zhou Zheng Zhu Holger Caesar Miaojing Shi VLM 100 3 0 15 Jul 2024
Quantized Prompt for Efficient Generalization of Vision-Language Models Tianxiang Hao Xiaohan Ding Juexiao Feng Yuhong Yang Hui Chen Guiguang Ding VLM MQ 94 5 0 15 Jul 2024
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection Xingyu Peng Yan Bai Chen Gao Lirong Yang Fei Xia Beipeng Mu Xiaofei Wang Si Liu ObjD 78 3 0 12 Jul 2024
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization Jinlong Li Zequn Jie Elisa Ricci Lin Ma N. Sebe VLM 104 1 0 11 Jul 2024
Open-Event Procedure Planning in Instructional Videos Yilu Wu Hanlin Wang Jing Wang Limin Wang 93 1 0 06 Jul 2024
Open-Vocabulary X-ray Prohibited Item Detection via Fine-tuning CLIP Shuyang Lin Tong Jia Hao Wang Bowen Ma Mingyuan Li Dongyue Chen VLM ObjD 84 0 0 16 Jun 2024
OVMR: Open-Vocabulary Recognition with Multi-Modal References Zehong Ma Shiliang Zhang Longhui Wei Qi Tian VLM 104 0 0 07 Jun 2024
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation Mohamed El Amine Boudjoghra Angela Dai Jean Lahoud Hisham Cholakkal Rao Muhammad Anwer Salman Khan Fahad Shahbaz Khan VLM ISeg 190 6 0 04 Jun 2024
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection Jiaming Li Jiacheng Zhang Jichang Li Ge Li Si Liu Liang Lin Guanbin Li ObjD VLM 114 14 0 01 Jun 2024
CapeX: Category-Agnostic Pose Estimation from Textual Point Explanation M. Rusanovsky Or Hirschorn S. Avidan 78 4 0 01 Jun 2024