Language-driven Semantic Segmentation

10 January 2022

Boyi Li

Papers citing "Language-driven Semantic Segmentation"

50 / 478 papers shown

Title
Lifting by Gaussians: A Simple, Fast and Flexible Method for 3D Instance Segmentation Rohan Chacko Nicolai Haeni Eldar Khaliullin Lin Sun Douglas Lee 3DGS 44 1 0 31 Jan 2025
DynamicEarth: How Far are We from Open-Vocabulary Change Detection? Kaiyu Li Xiangyong Cao Yupeng Deng Chao Pang Zepeng Xin Deyu Meng Zhi Wang ObjD 69 1 0 22 Jan 2025
DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data Yuanpeng Tu Xi Chen Ser-Nam Lim Hengshuang Zhao 38 0 0 03 Jan 2025
PanoSLAM: Panoptic 3D Scene Reconstruction via Gaussian SLAM Runnan Chen Zhaoqing Wang Jiepeng Wang Yuexin Ma Mingming Gong Wenping Wang Tongliang Liu 3DGS 37 1 0 03 Jan 2025
PRISM: Efficient Long-Range Reasoning With Short-Context LLMs Dulhan Jayalath James Bradley Wendt Nicholas Monath Sandeep Tata Beliz Gunel CLL LRM 51 1 0 25 Dec 2024
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding Hao Li Roy Qin Zhengyu Zou Diqi He Yangqiu Song Bingquan Dai Dingewn Zhang J. Han 3DGS 49 1 0 23 Dec 2024
Editing Implicit and Explicit Representations of Radiance Fields: A Survey Arthur Hubert Gamal Elghazaly R. Frank AI4CE 141 0 0 23 Dec 2024
DINOv2 Meets Text: A Unified Framework for Image- and Pixel-Level Vision-Language Alignment Cijo Jose Théo Moutakanni Dahyun Kang Federico Baldassarre Timothée Darcet ... Maxime Oquab Oriane Siméoni Huy V. Vo Patrick Labatut Piotr Bojanowski CLIP VLM 100 6 0 20 Dec 2024
Can video generation replace cinematographers? Research on the cinematic language of generated video Xiaomeng Li Kai WU Siyi Yang YiZhan Qu Guohua. Zhang ... Mingliang Xiong Hao Deng Qingwen Liu Gang Li Bin He VGen DiffM 90 1 0 16 Dec 2024
Feat2GS: Probing Visual Foundation Models with Gaussian Splatting Yue Chen Xingyu Chen Anpei Chen Gerard Pons-Moll Yuliang Xiu 3DGS 86 3 0 12 Dec 2024
LMSeg: Unleashing the Power of Large-Scale Models for Open-Vocabulary Semantic Segmentation Huadong Tang Youpeng Zhao Y. Huang Min Xu Jun Wang Qiang Wu MLLM VLM 78 0 0 30 Nov 2024
Talking to DINO: Bridging Self-Supervised Vision Backbones with Language for Open-Vocabulary Segmentation Luca Barsellotti Lorenzo Bianchi Nicola Messina F. Carrara Marcella Cornia Lorenzo Baraldi Fabrizio Falchi Rita Cucchiara VLM 72 2 0 28 Nov 2024
Language Driven Occupancy Prediction Zhu Yu Bowen Pang Lizhe Liu Runmin Zhang Qihao Peng Maochun Luo Sheng Yang Mingxia Chen Si-Yuan Cao Hui-Liang Shen 89 2 0 25 Nov 2024
Self-Calibrated CLIP for Training-Free Open-Vocabulary Segmentation Sule Bai Yong-Jin Liu Yifei Han Haoji Zhang Yansong Tang VLM 79 3 0 24 Nov 2024
XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation Ziyi Wang Y. Wang Xumin Yu Jie Zhou Jiwen Lu 74 0 0 20 Nov 2024
Gradient-Weighted Feature Back-Projection: A Fast Alternative to Feature Distillation in 3D Gaussian Splatting Joji Joseph B. Amrutur Shalabh Bhatnagar 3DGS 71 0 0 19 Nov 2024
VLN-Game: Vision-Language Equilibrium Search for Zero-Shot Semantic Navigation Bangguo Yu Yuzhen Liu Lei Han H. Kasaei Tingguang Li M. Cao LM&Ro 69 2 0 18 Nov 2024
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements M. Arda Aydın Efe Mert Çırpar Elvin Abdinli Gözde B. Ünal Y. Sahin VLM 71 0 0 18 Nov 2024
Modeling Uncertainty in 3D Gaussian Splatting through Continuous Semantic Splatting Joey Wilson Marcelino Almeida Min Sun Sachit Mahajan Maani Ghaffari Parker Ewen Omid Ghasemalizadeh Cheng-Hao Kuo Arnie Sen 3DGS 49 4 0 04 Nov 2024
Language-guided Hierarchical Fine-grained Image Forgery Detection and Localization Xiao Guo Xiaohong Liu I. Masi Xiaoming Liu 95 9 0 31 Oct 2024
Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation Zhaochong An Guolei Sun Yun Liu Runjia Li Min Wu Ming-Ming Cheng Ender Konukoglu Serge J. Belongie 64 4 0 29 Oct 2024
Open-Vocabulary Object Detection via Language Hierarchy Jiaxing Huang Jingyi Zhang Kai Jiang Shijian Lu ObjD VLM 31 1 0 27 Oct 2024
Neural Fields in Robotics: A Survey Muhammad Zubair Irshad Mauro Comi Yen-Chen Lin Nick Heppert Abhinav Valada Rares Ambrus Z. Kira Jonathan Tremblay AI4CE 50 3 0 26 Oct 2024
Context-Based Visual-Language Place Recognition Soojin Woo Seong-Woo Kim 24 0 0 25 Oct 2024
Large Spatial Model: End-to-end Unposed Images to Semantic 3D Zhiwen Fan Jian Zhang Wenyan Cong Peihao Wang Renjie Li ... Zhilin Wang Danfei Xu Boris Ivanovic Marco Pavone Yue Wang 3DV 41 11 0 24 Oct 2024
Scene Graph Generation with Role-Playing Large Language Models Guikun Chen Jin Li Wenguan Wang VLM 48 5 0 20 Oct 2024
LUDVIG: Learning-free Uplifting of 2D Visual features to Gaussian Splatting scenes Juliette Marrie Romain Menegaux Michael Arbel Diane Larlus Julien Mairal 3DGS 41 1 0 18 Oct 2024
Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features Makram Chahine Alex Quach Alaa Maalouf Tsun-Hsuan Wang Daniela Rus 23 0 0 16 Oct 2024
LatentBKI: Open-Dictionary Continuous Mapping in Visual-Language Latent Spaces with Quantifiable Uncertainty Joey Wilson Ruihan Xu Yile Sun Parker Ewen Minghan Zhu Kira Barton Maani Ghaffari 36 0 0 15 Oct 2024
Overcoming Domain Limitations in Open-vocabulary Segmentation Dongjun Hwang Seong Joon Oh Junsuk Choe SSeg OOD 58 0 0 15 Oct 2024
MoTE: Reconciling Generalization with Specialization for Visual-Language to Video Knowledge Transfer Minghao Zhu Zhengpu Wang Mengxian Hu Ronghao Dang Xiao Lin Xun Zhou Chengju Liu Qijun Chen 37 1 0 14 Oct 2024
LOBG:Less Overfitting for Better Generalization in Vision-Language Model Chenhao Ding Xinyuan Gao Songlin Dong Yuhang He Qiang Wang Alex C. Kot Yihong Gong VLM 34 1 0 14 Oct 2024
Emerging Pixel Grounding in Large Multimodal Models Without Grounding Supervision Shengcao Cao Liang-Yan Gui Yu-Xiong Wang 46 3 0 10 Oct 2024
3D Vision-Language Gaussian Splatting Qucheng Peng Benjamin Planche Zhongpai Gao Meng Zheng Anwesa Choudhuri Terrence Chen Cheng Chen Ziyan Wu 3DGS 41 4 0 10 Oct 2024
Open-RGBT: Open-vocabulary RGB-T Zero-shot Semantic Segmentation in Open-world Environments Meng Yu Luojie Yang Xunjie He Yi Yang Yufeng Yue VLM 30 0 0 09 Oct 2024
Brain Mapping with Dense Features: Grounding Cortical Semantic Selectivity in Natural Images With Vision Transformers Andrew F. Luo Jacob Yeung Rushikesh Zawar Shaurya Dewan Margaret M. Henderson Leila Wehbe Michael J. Tarr 34 3 0 07 Oct 2024
Multimodal 3D Fusion and In-Situ Learning for Spatially Aware AI Chengyuan Xu Radha Kumaran Noah Stier Kangyou Yu Tobias Höllerer 37 0 0 06 Oct 2024
PANav: Toward Privacy-Aware Robot Navigation via Vision-Language Models Bangguo Yu H. Kasaei Ming Cao 32 0 0 05 Oct 2024
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images Kaiyu Li Ruixun Liu Xiangyong Cao Deyu Meng Zhi Wang Deyu Meng Zhi Wang 36 3 0 02 Oct 2024
Open-vocabulary Multimodal Emotion Recognition: Dataset, Metric, and Benchmark Zheng Lian Haiyang Sun Guoying Zhao Lan Chen Haoyu Chen ... Rui Liu Shan Liang Ya Li Jiangyan Yi Jianhua Tao VLM 29 0 0 02 Oct 2024
Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking Ayesha Ishaq Mohamed El Amine Boudjoghra Jean Lahoud F. Khan Salman Khan Hisham Cholakkal Rao Muhammad Anwer 94 1 0 02 Oct 2024
Efficient Backdoor Defense in Multimodal Contrastive Learning: A Token-Level Unlearning Method for Mitigating Threats Kuanrong Liu Siyuan Liang Jiawei Liang Pengwen Dai Xiaochun Cao MU AAML 36 1 0 29 Sep 2024
Gaussian Heritage: 3D Digitization of Cultural Heritage with Integrated Object Segmentation Mahtab Dahaghin Myrna Castillo Kourosh Riahidehkordi M. Toso Alessio Del Bue 3DGS 32 1 0 27 Sep 2024
Search3D: Hierarchical Open-Vocabulary 3D Segmentation Ayca Takmaz Alexandros Delitzas R. Sumner Francis Engelmann Johanna Wald Federico Tombari 78 11 0 27 Sep 2024
ChatCam: Empowering Camera Control through Conversational AI Xinhang Liu Yu-Wing Tai Chi-Keung Tang VGen 33 2 0 25 Sep 2024
DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation Soojin Jang Jungmin Yun Junehyoung Kwon Eunju Lee Youngbin Kim 40 3 0 24 Sep 2024
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models Mike Zhang Kaixian Qu Vaishakh Patil Cesar Cadena Marco Hutter LM&Ro 3DV 38 4 0 23 Sep 2024
SplatLoc: 3D Gaussian Splatting-based Visual Localization for Augmented Reality Hongjia Zhai Xiyu Zhang Boming Zhao Hai Li Yijia He Zhaopeng Cui Hujun Bao Guofeng Zhang 3DGS 41 10 0 21 Sep 2024
One Map to Find Them All: Real-time Open-Vocabulary Mapping for Zero-shot Multi-Object Navigation F. L. Busch Timon Homberger Jesús Ortega-Peimbert Quantao Yang Olov Andersson 34 1 0 18 Sep 2024
Prompt-and-Transfer: Dynamic Class-aware Enhancement for Few-shot Segmentation Hanbo Bi Yingchao Feng Wenhui Diao Peijin Wang Yongqiang Mao Kun Fu Hongqi Wang Xian Sun VLM 34 3 0 16 Sep 2024