v1v2 (latest)

ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes

14 February 2017

Matthias Nießner

Papers citing "ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes"

50 / 2,387 papers shown

Title
HumanGif: Single-View Human Diffusion with Generative Prior Shoukang Hu Takuya Narihira Kazumi Fukuda Ryosuke Sawata Takashi Shibuya Yuki Mitsufuji 205 2 0 01 Jul 2025
FlatFusion: Delving into Details of Sparse Transformer-based Camera-LiDAR Fusion for Autonomous Driving Yutao Zhu Xiaosong Jia Xinyu Yang Junchi Yan ViT 80 6 0 01 Jul 2025
ForestFormer3D: A Unified Framework for End-to-End Segmentation of Forest LiDAR 3D Point Clouds Binbin Xiang Maciej Wielgosz Stefano Puliti Kamil Král Martin Krůček Azim Missarov R. Astrup 3DV 18 0 0 20 Jun 2025
Co-VisiON: Co-Visibility ReasONing on Sparse Image Sets of Indoor Scenes Chao-Yeh Chen Nobel Dang Juexiao Zhang Wenkai Sun Pengfei Zheng Xuhang He Yimeng Ye Taarun Srinivas Taarun Srinivas Chen Feng 3DV 25 0 0 20 Jun 2025
BoxFusion: Reconstruction-Free Open-Vocabulary 3D Object Detection via Real-Time Multi-View Box Fusion Yuqing Lan Chenyang Zhu Zhirui Gao JIazhao Zhang Yihan Cao Renjiao Yi Yijie Wang Kai Xu 3DPC 29 0 0 18 Jun 2025
Unified Representation Space for 3D Visual Grounding Yinuo Zheng Lipeng Gu Honghua Chen Liangliang Nan Mingqiang Wei 21 0 0 17 Jun 2025
FreeQ-Graph: Free-form Querying with Semantic Consistent Scene Graph for 3D Scene Understanding Chenlu Zhan Gaoang Wang Hongwei Wang 3DV 16 0 0 16 Jun 2025
Vid-CamEdit: Video Camera Trajectory Editing with Generative Rendering from Estimated Geometry Junyoung Seo Jisang Han Jaewoo Jung Siyoon Jin Joungbin Lee ... Takashi Shibuya Donghoon Ahn Shoukang Hu Seungryong Kim Yuki Mitsufuji VGen 34 0 0 16 Jun 2025
OV-MAP : Open-Vocabulary Zero-Shot 3D Instance Segmentation Map for Robots Juno Kim Yesol Park Hye Jung Yoon Byoung-Tak Zhang 71 0 0 13 Jun 2025
EQA-RM: A Generative Embodied Reward Model with Test-time Scaling Yuhang Chen Zhen Tan Tianlong Chen 105 0 0 12 Jun 2025
LEO-VL: Towards 3D Vision-Language Generalists via Data Scaling with Efficient Representation J. Huang Xiaojian Ma Xiongkun Linghu Yue Fan Junchao He ... Qing Li Song-Chun Zhu Yixin Chen Baoxiong Jia Siyuan Huang 77 0 0 11 Jun 2025
The Less You Depend, The More You Learn: Synthesizing Novel Views from Sparse, Unposed Images without Any 3D Knowledge Haoru Wang Kai Ye Yangyan Li Wenzheng Chen Baoquan Chen 69 0 0 11 Jun 2025
3DGeoDet: General-purpose Geometry-aware Image-based 3D Object Detection Yi Zhang Y. X. R. Wang Yawen Cui Lap-Pui Chau 3DPC 67 0 0 11 Jun 2025
UniForward: Unified 3D Scene and Semantic Field Reconstruction via Feed-Forward Gaussian Splatting from Only Sparse-View Images Qijian Tian Xin Tan Jingyu Gong Yuan Xie Lizhuang Ma 3DGS 59 0 0 11 Jun 2025
SemanticSplat: Feed-Forward 3D Scene Understanding with Language-Aware Gaussian Fields Qijing Li Jingxiang Sun Liang An Zhaoqi Su Hongwen Zhang Yebin Liu 62 1 0 11 Jun 2025
UniPre3D: Unified Pre-training of 3D Point Cloud Models with Cross-Modal Gaussian Splatting Ziyi Wang Yanran Zhang Jie Zhou Jiwen Lu 3DPC 3DGS 57 0 0 11 Jun 2025
FUSE: Measure-Theoretic Compact Fuzzy Set Representation for Taxonomy Expansion Fred Xu Song Jiang Z. Huang Xiao Luo Shichang Zhang Adrian Chen Yizhou Sun 22 3 0 10 Jun 2025
SpatialLM: Training Large Language Models for Structured Indoor Modeling Yongsen Mao Junhao Zhong Chuan Fang Jia Zheng Rui Tang Hao Zhu Ping Tan Zihan Zhou 3DV 13 1 0 09 Jun 2025
LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds Zihui Zhang Weisheng Dai Hongtao Wen Bo Yang 3DPC 26 0 0 09 Jun 2025
OpenSplat3D: Open-Vocabulary 3D Instance Segmentation using Gaussian Splatting Jens Piekenbrinck Christian Schmidt Alexander Hermans Narunas Vaskevicius Timm Linder Bastian Leibe 3DGS VLM 19 0 0 09 Jun 2025
GS4: Generalizable Sparse Splatting Semantic SLAM Mingqi Jiang Chanho Kim Chen Ziwen Li Fuxin 3DGS 15 0 0 06 Jun 2025
Pts3D-LLM: Studying the Impact of Token Structure for 3D Scene Understanding With Large Language Models Hugues Thomas Chen Chen Jian Zhang 37 0 0 06 Jun 2025
Does Your 3D Encoder Really Work? When Pretrain-SFT from 2D VLMs Meets 3D VLMs Haoyuan Li Yanpeng Zhou Yufei Gao Tao Tang J. N. Han Yujie Yuan Dave Zhenyu Chen Jiawang Bian Hang Xu Xiaodan Liang 116 0 0 05 Jun 2025
Defurnishing with X-Ray Vision: Joint Removal of Furniture from Panoramas and Mesh Alan Dolhasz Chen Ma Dave Gausebeck Kevin Chen Gregor Miller Lucas Hayne Gunnar Hovden Azwad Sabik Olaf Brandt Mira Slavcheva 167 0 0 05 Jun 2025
Grounding Beyond Detection: Enhancing Contextual Understanding in Embodied 3D Grounding Yani Zhang Dongming Wu Hao Shi Yingfei Liu Tiancai Wang Haoqiang Fan Xingping Dong ObjD 101 0 0 05 Jun 2025
Deep Learning Reforms Image Matching: A Survey and Outlook Shihua Zhang Zizhuo Li Kaining Zhang Yifan Lu Yuxin Deng Linfeng Tang Xingyu Jiang Jiayi Ma 3DV 108 0 0 05 Jun 2025
From Objects to Anywhere: A Holistic Benchmark for Multi-level Visual Grounding in 3D Scenes Tianxu Wang Zhuofan Zhang Ziyu Zhu Yue Fan Jing Xiong Pengxiang Li Xiaojian Ma Qing Li 101 0 0 05 Jun 2025
SupeRANSAC: One RANSAC to Rule Them All Daniel Barath 94 0 0 05 Jun 2025
Object-X: Learning to Reconstruct Multi-Modal 3D Object Representations Gaia Di Lorenzo F. Tombari Marc Pollefeys Daniel Barath 3DPC 111 0 0 05 Jun 2025
Perfecting Depth: Uncertainty-Aware Enhancement of Metric Depth Jinyoung Jun Lei Chu Jiahao Li Yan Lu Chang-Su Kim MDE 133 0 0 05 Jun 2025
Struct2D: A Perception-Guided Framework for Spatial Reasoning in Large Multimodal Models Fangrui Zhu Hanhui Wang Yiming Xie Jing Gu Tianye Ding Jianwei Yang Huaizu Jiang 3DV LRM 102 0 0 04 Jun 2025
You Only Train Once Christos Sakaridis 34 0 0 04 Jun 2025
VTGaussian-SLAM: RGBD SLAM for Large Scale Scenes with Splatting View-Tied 3D Gaussians Pengchong Hu Zhizhong Han 3DGS 68 0 0 03 Jun 2025
Dense Match Summarization for Faster Two-view Estimation Jonathan Astermark Anders Heyden Viktor Larsson 3DV 3DH 54 0 0 03 Jun 2025
LEG-SLAM: Real-Time Language-Enhanced Gaussian Splatting for SLAM Roman Titkov Egor Zubkov Dmitry A. Yudin Jaafar Mahmoud Malik Mohrat Gennady Sidorov 3DGS 61 0 0 03 Jun 2025
Towards In-the-wild 3D Plane Reconstruction from a Single Image Jiachen Liu Rui Yu Sili Chen Sharon X. Huang Hengkai Guo 3DV 67 1 0 03 Jun 2025
Diff2Flow: Training Flow Matching Models via Diffusion Model Alignment Johannes Schusterbauer Ming Gui Frank Fundel Bjorn Ommer 26 0 0 02 Jun 2025
Self-supervised Latent Space Optimization with Nebula Variational Coding Yida Wang D. Tan Nassir Navab Federico Tombari DRL SSL 81 1 0 02 Jun 2025
Rig3R: Rig-Aware Conditioning for Learned 3D Reconstruction Samuel Li Pujith Kachana Prajwal Chidananda Saurabh Nair Yasutaka Furukawa Matthew Brown 43 1 0 02 Jun 2025
DualMap: Online Open-Vocabulary Semantic Mapping for Natural Language Navigation in Dynamic Changing Scenes Jiajun Jiang Yiming Zhu Zirui Wu Jie Song 50 0 0 02 Jun 2025
SAB3R: Semantic-Augmented Backbone in 3D Reconstruction Xuweiyi Chen Tian Xia Sihan Xu Jianing Yang Joyce Chai Zezhou Cheng 39 0 0 02 Jun 2025
GraphPad: Inference-Time 3D Scene Graph Updates for Embodied Question Answering Muhammad Qasim Ali Saeejith Nair Alexander Wong Yuchen Cui Yuhao Chen 30 0 0 01 Jun 2025
Globally Consistent RGB-D SLAM with 2D Gaussian Splatting Xingguang Zhong Yue Pan Liren Jin Marija Popović Jens Behley C. Stachniss 3DGS 3DV 46 0 0 01 Jun 2025
Flying Co-Stereo: Enabling Long-Range Aerial Dense Mapping via Collaborative Stereo Vision of Dynamic-Baseline Zhaoying Wang Xingxing Zuo Wei Dong 37 0 0 31 May 2025
Learning from Videos for 3D World: Enhancing MLLMs with 3D Vision Geometry Priors Duo Zheng Shijia Huang Yanyang Li Liwei Wang 31 0 0 30 May 2025
Tackling View-Dependent Semantics in 3D Language Gaussian Splatting Jiazhong Cen Xudong Zhou Jiemin Fang Changsong Wen Lingxi Xie Xiaopeng Zhang Wei Shen Qi Tian 3DGS 38 0 0 30 May 2025
Visual Embodied Brain: Let Multimodal Large Language Models See, Think, and Control in Spaces Gen Luo Ganlin Yang Ziyang Gong Guanzhou Chen Haonan Duan ... Wenhai Wang Jifeng Dai Yu Qiao Rongrong Ji X. Zhu LM&Ro 27 1 0 30 May 2025
A Divide-and-Conquer Approach for Global Orientation of Non-Watertight Scene-Level Point Clouds Using 0-1 Integer Optimization Zhuodong Li Fei Hou Wencheng Wang Xuequan Lu Ying He 3DPC 97 0 0 29 May 2025
HyperPointFormer: Multimodal Fusion in 3D Space with Dual-Branch Cross-Attention Transformers Aldino Rizaldy R. Gloaguen Fabian Ewald Fassnacht Pedram Ghamisi 3DPC 35 0 0 29 May 2025
Diffusion-Based Generative Models for 3D Occupancy Prediction in Autonomous Driving Y. Wang Yicheng Liu Tianyuan Yuan Yucheng Mao Yingshi Liang Xiuyu Yang Honggang Zhang DiffM 38 0 0 29 May 2025