Language-driven Semantic Segmentation

10 January 2022

Boyi Li

Papers citing "Language-driven Semantic Segmentation"

50 / 478 papers shown

Title
Global Knowledge Calibration for Fast Open-Vocabulary Segmentation Kunyang Han Yong-Jin Liu Jun Hao Liew Henghui Ding Yunchao Wei ... Yitong Wang Yansong Tang Yujiu Yang Jiashi Feng Yao-Min Zhao VLM 39 36 0 16 Mar 2023
MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge Wei Lin Leonid Karlinsky Nina Shvetsova Horst Possegger Mateusz Koziñski Rameswar Panda Rogerio Feris Hilde Kuehne Horst Bischof VLM 102 38 0 15 Mar 2023
RICO: Regularizing the Unobservable for Indoor Compositional Reconstruction Zizhang Li Xiaoyang Lyu Yuanyuan Ding Mengmeng Wang Yiyi Liao Yong-Jin Liu 35 10 0 15 Mar 2023
A Simple Framework for Open-Vocabulary Segmentation and Detection Hao Zhang Feng Li Xueyan Zou Siyi Liu Chun-yue Li Jianfeng Gao Jianwei Yang Lei Zhang ObjD VLM 22 150 0 14 Mar 2023
Audio Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard VGen 68 33 0 13 Mar 2023
Architext: Language-Driven Generative Architecture Design Theodoros Galanos Antonios Liapis Georgios N. Yannakakis VLM AI4CE 26 6 0 13 Mar 2023
Robotic Applications of Pre-Trained Vision-Language Models to Various Recognition Behaviors Kento Kawaharazuka Yoshiki Obinata Naoaki Kanazawa K. Okada Masayuki Inaba LM&Ro 30 11 0 10 Mar 2023
Iterative Few-shot Semantic Segmentation from Image Label Text Haohan Wang L. Liu Wuhao Zhang Jiangning Zhang Zhenye Gan Yabiao Wang Chengjie Wang Haoqian Wang VLM 24 16 0 10 Mar 2023
Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models Jiarui Xu Sifei Liu Arash Vahdat Wonmin Byeon Xiaolong Wang Shalini De Mello VLM 223 320 0 08 Mar 2023
CLIP-FO3D: Learning Free Open-world 3D Scene Representations from 2D Dense CLIP Junbo Zhang Runpei Dong Kaisheng Ma CLIP VLM 29 77 0 08 Mar 2023
CLIP-guided Prototype Modulating for Few-shot Action Recognition Xiang Wang Shiwei Zhang Jun Cen Changxin Gao Yingya Zhang Deli Zhao Nong Sang VLM 27 53 0 06 Mar 2023
Open-Vocabulary Affordance Detection in 3D Point Clouds Toan Ngyen Minh Nhat Vu Annalies Vuong Dzung Nguyen T. Vo Ngan Le A. Nguyen 3DPC 24 32 0 04 Mar 2023
Image Labels Are All You Need for Coarse Seagrass Segmentation Scarlett Raine Ross Marchant Branislav Kusy Frederic Maire Tobias Fischer 22 5 0 02 Mar 2023
Turning a CLIP Model into a Scene Text Detector Wenwen Yu Yuliang Liu Wei Hua Deqiang Jiang Bo Ren Xiang Bai VLM CLIP MLLM 36 53 0 28 Feb 2023
A Language-Guided Benchmark for Weakly Supervised Open Vocabulary Semantic Segmentation Prashant Pandey Mustafa Chasmai Monish Natarajan Brejesh Lall VLM 36 5 0 27 Feb 2023
Aligning Bag of Regions for Open-Vocabulary Object Detection Size Wu Wenwei Zhang Sheng Jin Wentao Liu Chen Change Loy VLM ObjD 44 108 0 27 Feb 2023
Semantic Mechanical Search with Large Vision and Language Models Satvik Sharma Huang Huang K. Shivakumar A. Imran Ryan Hoque Brian Ichter Ken Goldberg LM&Ro VLM 29 5 0 24 Feb 2023
Side Adapter Network for Open-Vocabulary Semantic Segmentation Mengde Xu Zheng-Wei Zhang Fangyun Wei Han Hu Xiang Bai VLM 26 247 0 23 Feb 2023
Teaching CLIP to Count to Ten Roni Paiss Ariel Ephrat Omer Tov Shiran Zada Inbar Mosseri Michal Irani Tali Dekel VLM CLIP 34 89 0 23 Feb 2023
ConceptFusion: Open-set Multimodal 3D Mapping Krishna Murthy Jatavallabhula Ali Kuwajerwala Qiao Gu Mohd. Omama Tao Chen ... Celso Miguel de Melo Madhava Krishna Liam Paull Florian Shkurti Antonio Torralba 22 231 0 14 Feb 2023
Semantic Image Segmentation: Two Decades of Research G. Csurka Riccardo Volpi Boris Chidlovskii 3DV 35 50 0 13 Feb 2023
SimCon Loss with Multiple Views for Text Supervised Semantic Segmentation Yash J. Patel Yusheng Xie Yi Zhu Srikar Appalaraju R. Manmatha 35 4 0 07 Feb 2023
Language-Driven Anchors for Zero-Shot Adversarial Robustness Xiao-Li Li Wei Emma Zhang Yining Liu Zhan Hu Bo-Wen Zhang Xiaolin Hu 34 8 0 30 Jan 2023
ZegOT: Zero-shot Segmentation Through Optimal Transport of Text Prompts Kwanyoung Kim Y. Oh Jong Chul Ye VLM OT CLIP 26 19 0 28 Jan 2023
Vision-Language Models Performing Zero-Shot Tasks Exhibit Gender-based Disparities Melissa Hall Laura Gustafson Aaron B. Adcock Ishan Misra Candace Ross VLM 40 22 0 26 Jan 2023
Learning Open-vocabulary Semantic Segmentation Models From Natural Language Supervision Jilan Xu Junlin Hou Yuejie Zhang Rui Feng Yi Wang Yu Qiao Weidi Xie VLM 21 81 0 22 Jan 2023
Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic Segmentation S. D. Dao Hengcan Shi Dinh Q. Phung Jianfei Cai VLM 34 0 0 18 Jan 2023
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation Jianzong Wu Xiangtai Li Henghui Ding Xia Li Guangliang Cheng Yu Tong Chen Change Loy VLM 85 31 0 02 Jan 2023
CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection Jie Liu Yixiao Zhang Jieneng Chen Junfei Xiao Yongyi Lu Bennett A. Landman Yixuan Yuan Alan Yuille Yucheng Tang Zongwei Zhou VLM MedIm 39 194 0 02 Jan 2023
Interactive Segmentation of Radiance Fields Rahul Goel Dhawal Sirikonda Saurabh Saini P. J. Narayanan 26 49 0 27 Dec 2022
Generalized Decoding for Pixel, Image, and Language Xueyan Zou Zi-Yi Dou Jianwei Yang Zhe Gan Linjie Li ... Lu Yuan Nanyun Peng Lijuan Wang Yong Jae Lee Jianfeng Gao VLM MLLM ObjD 21 241 0 21 Dec 2022
3D Highlighter: Localizing Regions on 3D Shapes via Text Descriptions Dale Decatur Itai Lang Rana Hanocka 24 25 0 21 Dec 2022
PaletteNeRF: Palette-based Appearance Editing of Neural Radiance Fields Zhengfei Kuang Fujun Luan Sai Bi Zhixin Shu Gordon Wetzstein Kalyan Sunkavalli 32 44 0 21 Dec 2022
Panoptic Lifting for 3D Scene Understanding with Neural Fields Yawar Siddiqui Lorenzo Porzi Samuel Rota Buló Norman Muller Matthias Nießner Angela Dai Peter Kontschieder 42 128 0 19 Dec 2022
CREPE: Can Vision-Language Foundation Models Reason Compositionally? Zixian Ma Jerry Hong Mustafa Omer Gul Mona Gandhi Irena Gao Ranjay Krishna CoGe 29 125 0 13 Dec 2022
Open Vocabulary Semantic Segmentation with Patch Aligned Contrastive Learning Jishnu Mukhoti Tsung-Yu Lin Omid Poursaeed Rui Wang Ashish Shah Philip H. S. Torr Ser-Nam Lim VLM 30 79 0 09 Dec 2022
PØDA: Prompt-driven Zero-shot Domain Adaptation Mohammad Fahes Tuan-Hung Vu Andrei Bursuc Patrick Pérez Raoul de Charette VLM 38 45 0 06 Dec 2022
Fine-tuned CLIP Models are Efficient Video Learners H. Rasheed Muhammad Uzair Khattak Muhammad Maaz Salman Khan F. Khan CLIP VLM 34 148 0 06 Dec 2022
Learning to Generate Text-grounded Mask for Open-world Semantic Segmentation from Only Image-Text Pairs Junbum Cha Jonghwan Mun Byungseok Roh VLM 23 87 0 01 Dec 2022
PLA: Language-Driven Open-Vocabulary 3D Scene Understanding Runyu Ding Jihan Yang Chuhui Xue Wenqing Zhang Song Bai Xiaojuan Qi VLM 15 147 0 29 Nov 2022
OpenScene: 3D Scene Understanding with Open Vocabularies Songyou Peng Kyle Genova ChiyuMaxJiang Andrea Tagliasacchi Marc Pollefeys Thomas Funkhouser 3DPC VLM 34 347 0 28 Nov 2022
SegCLIP: Patch Aggregation with Learnable Centers for Open-Vocabulary Semantic Segmentation Huaishao Luo Junwei Bao Youzheng Wu Xiaodong He Tianrui Li VLM 32 144 0 27 Nov 2022
ComCLIP: Training-Free Compositional Image and Text Matching Kenan Jiang Xuehai He Ruize Xu Qing Guo VLM CLIP CoGe 14 20 0 25 Nov 2022
Peekaboo: Text to Image Diffusion Models are Zero-Shot Segmentors R. Burgert Kanchana Ranasinghe Xiang Li Michael S. Ryoo DiffM VLM 34 37 0 23 Nov 2022
Open-vocabulary Semantic Segmentation with Frozen Vision-Language Models Chaofan Ma Yu-Hao Yang Yanfeng Wang Ya-Qin Zhang Weidi Xie VLM 26 48 0 27 Oct 2022
MovieCLIP: Visual Scene Recognition in Movies Digbalay Bose Rajat Hebbar Krishna Somandepalli Haoyang Zhang Huayu Chen K. Cole-McLaughlin Haoran Wang Shrikanth Narayanan CLIP 22 21 0 20 Oct 2022
Perceptual Grouping in Contrastive Vision-Language Models Kanchana Ranasinghe Brandon McKinzie S. S. Ravi Yinfei Yang Alexander Toshev Jonathon Shlens VLM 30 51 0 18 Oct 2022
Visual Language Maps for Robot Navigation Chen Huang Oier Mees Andy Zeng Wolfram Burgard LM&Ro 162 344 0 11 Oct 2022
Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP Feng Liang Bichen Wu Xiaoliang Dai Kunpeng Li Yinan Zhao Hang Zhang Peizhao Zhang Peter Vajda Diana Marculescu CLIP VLM 37 433 0 09 Oct 2022
CLIP-PAE: Projection-Augmentation Embedding to Extract Relevant Features for a Disentangled, Interpretable, and Controllable Text-Guided Face Manipulation Chenliang Zhou Fangcheng Zhong Cengiz Öztireli CLIP 48 19 0 08 Oct 2022