OpenScene: 3D Scene Understanding with Open Vocabularies

28 November 2022

Marc Pollefeys

Papers citing "OpenScene: 3D Scene Understanding with Open Vocabularies"

50 / 285 papers shown

Title
TS-VLM: Text-Guided SoftSort Pooling for Vision-Language Models in Multi-View Driving Reasoning Lihong Chen Hossein Hassani Soodeh Nikan VLM 2 0 0 19 May 2025
SpatialLLM: From Multi-modality Data to Urban Spatial Intelligence Jiabin Chen Haiping Wang Jinpeng Li Yuan Liu Zhen Dong Bisheng Yang 7 0 0 19 May 2025
Geofenced Unmanned Aerial Robotic Defender for Deer Detection and Deterrence (GUARD) Ebasa Temesgen Mario Jerez Greta Brown Graham Wilson Sree Ganesh Lalitaditya Divakarla Sarah Boelter Oscar Nelson Robert McPherson Maria Gini 22 0 0 16 May 2025
TransDiffuser: End-to-end Trajectory Generation with Decorrelated Multi-modal Representation for Autonomous Driving Xuefeng Jiang Yuan Ma Pengxiang Li Leimeng Xu Xin Wen Kun Zhan Zhongpu Xia Peng Jia Xianpeng Lang Sheng Sun DiffM 18 0 0 14 May 2025
TUGS: Physics-based Compact Representation of Underwater Scenes by Tensorized Gaussian Shijie Lian Ziyi Zhang Laurence Tianruo Yang and Mengyu Ren Debin Liu Hua Li 3DGS 41 0 0 12 May 2025
Cues3D: Unleashing the Power of Sole NeRF for Consistent and Unique Instances in Open-Vocabulary 3D Panoptic Segmentation Feng Xue Wenzhuang Xu Guofeng Zhong Anlong Minga N. Sebe 65 0 0 01 May 2025
OpenFusion++: An Open-vocabulary Real-time Scene Understanding System Xiaofeng Jin Matteo Frosi Matteo Matteucci 181 0 0 27 Apr 2025
Locate 3D: Real-World Object Localization via Self-Supervised Learning in 3D Sergio Arnaud Paul Mcvay Ada Martin Arjun Majumdar Krishna Murthy Jatavallabhula ... Nicolas Ballas Mido Assran Oleksandr Maksymets Aravind Rajeswaran Franziska Meier 3DPC 46 0 0 19 Apr 2025
HAECcity: Open-Vocabulary Scene Understanding of City-Scale Point Clouds with Superpoint Graph Clustering Alexander Rusnak Frédéric Kaplan 3DPC 49 0 0 18 Apr 2025
Towards Learning to Complete Anything in Lidar Ayca Takmaz Cristiano Saltori Neehar Peri Tim Meinhardt Riccardo de Lutio Laura Leal-Taixé Aljosa Osep 3DV VLM 48 0 0 16 Apr 2025
3D-PointZshotS: Geometry-Aware 3D Point Cloud Zero-Shot Semantic Segmentation Narrowing the Visual-Semantic Gap Minmin Yang Huantao Ren Senem Velipasalar 3DPC 44 0 0 16 Apr 2025
Multi-Object Grounding via Hierarchical Contrastive Siamese Transformers Chengyi Du Keyan Jin 32 0 0 14 Apr 2025
Embodied Chain of Action Reasoning with Multi-Modal Foundation Model for Humanoid Loco-manipulation Yu Hao Geeta Chandra Raju Bethala Niraj Pudasaini Hao Huang Shuaihang Yuan Congcong Wen Baoru Huang A. Nguyen Yi Fang LM&Ro AI4CE LRM 64 0 0 13 Apr 2025
DSM: Building A Diverse Semantic Map for 3D Visual Grounding Qinghongbing Xie Zijian Liang Long Zeng 34 0 0 11 Apr 2025
RayFronts: Open-Set Semantic Ray Frontiers for Online Scene Understanding and Exploration Omar Alama A. Bhattacharya Haoyang He Seungchan Kim Yuheng Qiu Wenshan Wang Cherie Ho Nikhil Varma Keetha Sebastian A. Scherer 31 0 0 09 Apr 2025
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding Pedro Hermosilla Christian Stippel Leon Sick SSL 3DPC 79 0 0 09 Apr 2025
A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras Teng Xiao Q. Hu Q. Yan Wei Liu Zhiwei Ye F. Deng 26 0 0 09 Apr 2025
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation Emmanuelle Bourigault A. Jamaludin Abdullah Hamdi 30 0 0 09 Apr 2025
econSG: Efficient and Multi-view Consistent Open-Vocabulary 3D Semantic Gaussians Can Zhang G. Lee 3DV 55 0 0 08 Apr 2025
Zero-Shot 4D Lidar Panoptic Segmentation Yushan Zhang Aljosa Osep Laura Leal-Taixé Tim Meinhardt 3DPC 50 1 0 01 Apr 2025
SuperDec: 3D Scene Decomposition with Superquadric Primitives Elisabetta Fedele Boyang Sun Leonidas J. Guibas Marc Pollefeys Francis Engelmann 3DPC 45 1 0 01 Apr 2025
Open-Vocabulary Semantic Segmentation with Uncertainty Alignment for Robotic Scene Understanding in Indoor Building Environments Yifan Xu V. Kamat Carol Menassa 51 0 0 29 Mar 2025
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis J. Huang Baoxiong Jia Yansen Wang Ziyu Zhu Xiongkun Linghu Qing Li Song-Chun Zhu Siyuan Huang 87 3 0 28 Mar 2025
Semantic Consistent Language Gaussian Splatting for Point-Level Open-vocabulary Querying Hairong Yin Huangying Zhan Yi Tian Xu Raymond A. Yeh 48 0 0 27 Mar 2025
OpenLex3D: A New Evaluation Benchmark for Open-Vocabulary 3D Scene Representations Christina Kassab Sacha Morin Martin Buchner Matías Mattamala Kumaraditya Gupta Abhinav Valada Liam Paull Maurice F. Fallon 3DV ELM 46 0 0 25 Mar 2025
LiDAR Remote Sensing Meets Weak Supervision: Concepts, Methods, and Perspectives Yuan Gao Shaobo Xia P. Wang Xiaohuan Xi Sheng Nie Cheng-Xiang Wang 47 1 0 24 Mar 2025
Open-Vocabulary Functional 3D Scene Graphs for Real-World Indoor Spaces Chenyangguang Zhang Alexandros Delitzas Fangjinhua Wang Ruida Zhang Xiangyang Ji Marc Pollefeys Francis Engelmann 3DV 3DPC 49 4 0 24 Mar 2025
MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation Jiaxin Huang Runnan Chen Ziwen Li Zhengqing Gao Xiao He Yandong Guo Mingming Gong Tongliang Liu LRM 56 0 0 23 Mar 2025
PanoGS: Gaussian-based Panoptic Segmentation for 3D Open Vocabulary Scene Understanding Hongjia Zhai Yiming Li Zhenzhe Li Xiaokun Pan Yijia He Guofeng Zhang 50 0 0 23 Mar 2025
SceneSplat: Gaussian Splatting-based Scene Understanding with Vision-Language Pretraining Yue Li Qi Ma Runyi Yang Huapeng Li Mengjiao Ma ... E. Konukoglu Theo Gevers Luc Van Gool Martin R. Oswald Danda Pani Paudel 3DGS VLM 79 0 0 23 Mar 2025
OpenCity3D: What do Vision-Language Models know about Urban Environments? Valentin Bieri Marco Zamboni Nicolas S. Blumer Qingxuan Chen Francis Engelmann 53 1 0 21 Mar 2025
Is there anything left? Measuring semantic residuals of objects removed from 3D Gaussian Splatting Simona Kocour Assia Benbihi Aikaterini Adam Torsten Sattler 3DPC 41 0 0 21 Mar 2025
Uni-3DAR: Unified 3D Generation and Understanding via Autoregression on Compressed Spatial Tokens Shuqi Lu Haowei Lin Lin Yao Zhifeng Gao Xiaohong Ji Weinan E Linfeng Zhang Guolin Ke 48 0 0 20 Mar 2025
Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding Jinlong Li Cristiano Saltori Fabio Poiesi N. Sebe 192 0 0 20 Mar 2025
Learning 3D Scene Analogies with Neural Contextual Scene Maps Junho Kim Gwangtak Bae E. Lee Young Min Kim 3DPC 3DV 62 0 0 20 Mar 2025
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model Zhaochong An Guolei Sun Yun Liu Runjia Li Junlin Han Ender Konukoglu Serge Belongie VLM 62 0 0 20 Mar 2025
SPNeRF: Open Vocabulary 3D Neural Scene Segmentation with Superpoints Weiwen Hu Niccolò Parodi Marcus Zepp I. Feldmann O. Schreer Peter Eisert VLM 165 0 0 19 Mar 2025
GO-N3RDet: Geometry Optimized NeRF-enhanced 3D Object Detector Zechuan Li Hongshan Yu Yihao Ding Jinhao Qiao Basim Azam Naveed Akhtar 3DPC 43 0 0 19 Mar 2025
OSMa-Bench: Evaluating Open Semantic Mapping Under Varying Lighting Conditions Maxim Popov Regina Kurkova Mikhail Iumanov Jaafar Mahmoud Sergey Kolyubin 39 0 0 13 Mar 2025
WildSeg3D: Segment Any 3D Objects in the Wild from 2D Images Yansong Guo Jie Hu Yansong Qu Liujuan Cao 3DGS 187 0 0 11 Mar 2025
SAS: Segment Any 3D Scene with Integrated 2D Priors Zechao Li Jiahao Lu Jiacheng Deng Hanzhi Chang Lifan Wu Yanzhe Liang Tianzhu Zhang 60 0 0 11 Mar 2025
PE3R: Perception-Efficient 3D Reconstruction Jie Hu Shizun Wang Xinchao Wang 68 0 0 10 Mar 2025
Learning A Zero-shot Occupancy Network from Vision Foundation Models via Self-supervised Adaptation Sihao Lin Daqi Liu Ruochong Fu Dongrui Liu A. Song Hongwei Xie Zhihui Li Bing Wang Xiaojun Chang 74 0 0 10 Mar 2025
SplatTalk: 3D VQA with Gaussian Splatting Anh Thai Songyou Peng Kyle Genova Leonidas J. Guibas Thomas Funkhouser 3DGS 82 0 0 08 Mar 2025
Integrating Chain-of-Thought for Multimodal Alignment: A Study on 3D Vision-Language Learning Yanjun Chen Yirong Sun Xinghao Chen Jian Wang Xiaoyu Shen W. Li Wei Zhang 3DV LRM 64 1 0 08 Mar 2025
GaussianGraph: 3D Gaussian-based Scene Graph Generation for Open-world Scene Understanding Xihan Wang Dianyi Yang Yu Gao Yufeng Yue Yi Yang M. Fu 3DGS 54 0 0 06 Mar 2025
OnlineAnySeg: Online Zero-Shot 3D Segmentation by Visual Foundation Model Guided 2D Mask Merging Yijie Tang Jiazhao Zhang Yuqing Lan Yulan Guo Dezun Dong Chenyang Zhu K. Xu 189 0 0 03 Mar 2025
Inst3D-LMM: Instance-Aware 3D Scene Understanding with Multi-modal Instruction Tuning Hanxun Yu Wentong Li Song Wang Jintai Chen Jianke Zhu 3DV LRM 86 3 0 01 Mar 2025
LIFT-GS: Cross-Scene Render-Supervised Distillation for 3D Language Grounding Ang Cao Sergio Arnaud Oleksandr Maksymets Jianing Yang Ayush Jain ... Aravind Rajeswaran Franziska Meier Justin Johnson Jeong Joon Park Alexander Sax 70 0 0 27 Feb 2025
Dr. Splat: Directly Referring 3D Gaussian Splatting via Direct Language Embedding Registration Kim Jun-Seong GeonU Kim Kim Yu-Ji Yu-Chun Wang Jaesung Choe Tae-Hyun Oh 3DGS 69 1 0 23 Feb 2025