GroupViT: Semantic Segmentation Emerges from Text Supervision

22 February 2022

Papers citing "GroupViT: Semantic Segmentation Emerges from Text Supervision"

50 / 124 papers shown

Title
What You Perceive Is What You Conceive: A Cognition-Inspired Framework for Open Vocabulary Image Segmentation Jianghang Lin Yue Hu Jiangtao Shen Yunhang Shen Liujuan Cao Shengchuan Zhang Rongrong Ji ObjD VLM 20 0 0 26 May 2025
Visual Perturbation and Adaptive Hard Negative Contrastive Learning for Compositional Reasoning in Vision-Language Models Xin Huang Ruibin Li Tong Jia Wei Zheng Ya Wang VLM CoGe 35 0 0 21 May 2025
From Local Details to Global Context: Advancing Vision-Language Models with Attention-Based Selection Lincan Cai Jingxuan Kang Shuang Li Wenxuan Ma Binhui Xie Zhida Qin Jian Liang VLM 36 0 0 19 May 2025
Causal Prompt Calibration Guided Segment Anything Model for Open-Vocabulary Multi-Entity Segmentation Wenwen Qiang Jianqi Zhang Jingyao Wang Changwen Zheng VLM 65 0 0 10 May 2025
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception Junjie Wang Bin Chen Yulin Li Bin Kang Yulin Chen Zhuotao Tian VLM 54 0 0 07 May 2025
OpenFusion++: An Open-vocabulary Real-time Scene Understanding System Xiaofeng Jin Matteo Frosi Matteo Matteucci 295 0 0 27 Apr 2025
DVLTA-VQA: Decoupled Vision-Language Modeling with Text-Guided Adaptation for Blind Video Quality Assessment Li Yu Situo Wang Wei Zhou Moncef Gabbouj 54 0 0 16 Apr 2025
Impact of Language Guidance: A Reproducibility Study Cherish Puniani Advika Sinha Shree Singhi Aayan Yadav VLM 75 0 0 10 Apr 2025
Falcon: Fractional Alternating Cut with Overcoming Minima in Unsupervised Segmentation Xiao Zhang Xiangyu Han Xiwen Lai Yao Sun Pei Zhang Konrad Kording 41 0 0 08 Apr 2025
HGFormer: Topology-Aware Vision Transformer with HyperGraph Learning Hao Wang Shuo Zhang Biao Leng ViT 84 1 0 03 Apr 2025
CTRL-O: Language-Controllable Object-Centric Visual Representation Learning Aniket Didolkar Andrii Zadaianchuk Rabiul Awal Maximilian Seitzer E. Gavves Aishwarya Agrawal OCL VLM 107 2 0 27 Mar 2025
SPNeRF: Open Vocabulary 3D Neural Scene Segmentation with Superpoints Weiwen Hu Niccolò Parodi Marcus Zepp I. Feldmann O. Schreer Peter Eisert VLM 288 0 0 19 Mar 2025
LIAM: Multimodal Transformer for Language Instructions, Images, Actions and Semantic Maps Yihao Wang Raphael Memmesheimer Sven Behnke LM&Ro 60 0 0 15 Mar 2025
Object-Centric World Model for Language-Guided Manipulation Youngjoon Jeong Junha Chun S. Cha Taesup Kim OCL VGen 258 2 0 08 Mar 2025
Object-centric Binding in Contrastive Language-Image Pretraining Rim Assouel Pietro Astolfi Florian Bordes M. Drozdzal Adriana Romero Soriano OCL VLM CoGe 108 0 0 19 Feb 2025
Laser: Efficient Language-Guided Segmentation in Neural Radiance Fields Xingyu Miao Haoran Duan Yang Bai Tejal Shah Jun Song Yang Long R. Ranjan Ling Shao 109 4 0 31 Jan 2025
DynamicEarth: How Far are We from Open-Vocabulary Change Detection? Kaiyu Li Xiangyong Cao Yupeng Deng Chao Pang Zepeng Xin Deyu Meng Zhi Wang ObjD 86 1 0 22 Jan 2025
Slot-BERT: Self-supervised Object Discovery in Surgical Video Guiqiu Liao M. Jogan Marcel Hussing Kenta Nakahashi Kazuhiro Yasufuku Amin Madani Eric Eaton Daniel A. Hashimoto 286 0 0 21 Jan 2025
SimLabel: Consistency-Guided OOD Detection with Pretrained Vision-Language Models Shu Zou Xinyu Tian Qinyu Zhao Zhaoyuan Yang Jing Zhang VLM 58 0 0 20 Jan 2025
DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data Yuanpeng Tu Xi Chen Ser-Nam Lim Hengshuang Zhao 73 1 0 03 Jan 2025
Can video generation replace cinematographers? Research on the cinematic language of generated video Xuelong Li Kai WU Siyi Yang YiZhan Qu Guohua. Zhang ... Mingliang Xiong Hao Deng Qingwen Liu Gang Li Bin He VGen DiffM 97 1 0 16 Dec 2024
Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation Chanyoung Kim Dayun Ju Woojung Han Ming-Hsuan Yang Seong Jae Hwang VLM VOS 89 0 0 26 Nov 2024
Self-Calibrated CLIP for Training-Free Open-Vocabulary Segmentation Sule Bai Yong-Jin Liu Yifei Han Haoji Zhang Yansong Tang VLM 120 3 0 24 Nov 2024
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements M. Arda Aydın Efe Mert Çırpar Elvin Abdinli Gözde B. Ünal Y. Sahin VLM 92 0 0 18 Nov 2024
GiVE: Guiding Visual Encoder to Perceive Overlooked Information Junjie Li Jianghong Ma Xiaofeng Zhang Yuhang Li Jianyang Shi 50 1 0 26 Oct 2024
Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation Ruting Chi Zhiyi Huang Yuexing Han ISeg 55 0 0 21 Oct 2024
InvSeg: Test-Time Prompt Inversion for Semantic Segmentation Jiayi Lin Jiabo Huang Jian Hu S. Gong DiffM VLM 57 0 0 15 Oct 2024
Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes Jianqi Chen Panwen Hu Xiaojun Chang Z. Shi Michael C. Kampffmeyer Xiaodan Liang 59 8 0 14 Oct 2024
Conjugated Semantic Pool Improves OOD Detection with Pre-trained Vision-Language Models Mengyuan Chen Junyu Gao Changsheng Xu VLM OODD 47 1 0 11 Oct 2024
iSeg: An Iterative Refinement-based Framework for Training-free Segmentation Lin Sun Jiale Cao J. Xie Fahad Shahbaz Khan Yanwei Pang DiffM 48 1 0 05 Sep 2024
ReCLIP++: Learn to Rectify the Bias of CLIP for Unsupervised Semantic Segmentation Jingyun Wang Guoliang Kang VLM SSL 70 7 0 13 Aug 2024
Explore the Potential of CLIP for Training-Free Open Vocabulary Semantic Segmentation Tong Shao Zhuotao Tian Hang Zhao Jingyong Su VLM 64 15 0 11 Jul 2024
Rethinking Image-to-Video Adaptation: An Object-centric Perspective Rui Qian Shuangrui Ding Dahua Lin OCL 59 1 0 09 Jul 2024
Foundational Models for Pathology and Endoscopy Images: Application for Gastric Inflammation H. Kerdegari Kyle Higgins Dennis Veselkov I. Laponogov I. Poļaka ... Junior Andrea Pescino M. Leja M. Dinis-Ribeiro T. F. Kanonnikoff Kirill Veselkov 57 3 0 26 Jun 2024
Towards Semantic Equivalence of Tokenization in Multimodal LLM Shengqiong Wu Hao Fei Xiangtai Li Jiayi Ji Hanwang Zhang Tat-Seng Chua Shuicheng Yan MLLM 67 33 0 07 Jun 2024
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation Mohamed El Amine Boudjoghra Angela Dai Jean Lahoud Hisham Cholakkal Rao Muhammad Anwer Salman Khan Fahad Shahbaz Khan VLM ISeg 83 6 0 04 Jun 2024
Boosting Architectural Generation via Prompts: Report Xin Zhang Wenwen Liu AI4CE 45 1 0 24 Apr 2024
Pay Attention to Your Neighbours: Training-Free Open-Vocabulary Semantic Segmentation Sina Hajimiri Ismail Ben Ayed Jose Dolz VLM 62 23 0 12 Apr 2024
Image-Text Co-Decomposition for Text-Supervised Semantic Segmentation Ji-Jia Wu Andy Chia-Hao Chang Chieh-Yu Chuang Chun-Pei Chen Yu-Lun Liu Min-Hung Chen Hou-Ning Hu Yung-Yu Chuang Yen-Yu Lin VLM 67 9 0 05 Apr 2024
Unsegment Anything by Simulating Deformation Jiahao Lu Xingyi Yang Xinchao Wang 41 4 0 03 Apr 2024
Segment Any 3D Object with Language Seungjun Lee Yuyang Zhao Gim Hee Lee 52 1 0 02 Apr 2024
Training-Free Semantic Segmentation via LLM-Supervision Wenfang Sun Yingjun Du Gaowen Liu Ramana Rao Kompella Cees G. M. Snoek VLM 63 2 0 31 Mar 2024
Clustering for Protein Representation Learning Ruijie Quan Wenguan Wang Fan Ma Hehe Fan Yi Yang 52 5 0 30 Mar 2024
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models Barbara Toniella Corradini Mustafa Shukor Paul Couairon Guillaume Couairon Franco Scarselli Matthieu Cord DiffM VLM 68 4 0 29 Mar 2024
Annotation Free Semantic Segmentation with Vision Foundation Models Soroush Seifi Daniel Olmeda Reino Fabien Despinoy Rahaf Aljundi VLM 62 1 0 14 Mar 2024
Multi-Grained Cross-modal Alignment for Learning Open-vocabulary Semantic Segmentation from Text Supervision Yajie Liu Pu Ge Qingjie Liu Di Huang 82 2 0 06 Mar 2024
Learning Pixel-wise Continuous Depth Representation via Clustering for Depth Completion Shenglun Chen Hong Zhang Xinzhu Ma Zhihui Wang Haojie Li 55 2 0 21 Feb 2024
Exploring Simple Open-Vocabulary Semantic Segmentation Zihang Lai VLM 33 0 0 22 Jan 2024
Open3DIS: Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance P. Nguyen T.D. Ngo E. Kalogerakis Chuang Gan Anh Tran Cuong Pham Khoi Duc Minh Nguyen ISeg 55 51 0 17 Dec 2023
CLIP-guided Federated Learning on Heterogeneous and Long-Tailed Data Jiangming Shi Shanshan Zheng Xiangbo Yin Yang Lu Yuan Xie Yanyun Qu VLM FedML 71 10 0 14 Dec 2023