3D-STMN: Dependency-Driven Superpoint-Text Matching Network for End-to-End 3D Referring Expression Segmentation

AAAI Conference on Artificial Intelligence (AAAI), 2023

31 August 2023

Qi Chen

Jiayi Ji

ArXiv (abs)PDF HTML Github (42★)

Papers citing "3D-STMN: Dependency-Driven Superpoint-Text Matching Network for End-to-End 3D Referring Expression Segmentation"

23 / 23 papers shown

DenseScan: Advancing 3D Scene Understanding with 2D Dense Annotation

Zirui Wang

Tao Zhang

3DV

276

28 Nov 2025

MoE3D: Mixture of Experts meets Multi-Modal 3D Understanding

141

27 Nov 2025

Scenes as Tokens: Multi-Scale Normal Distributions Transform Tokenizer for General 3D Vision-Language Understanding

210

26 Nov 2025

Task-Aware 3D Affordance Segmentation via 2D Guidance and Geometric Refinement

228

12 Nov 2025

Point Linguist Model: Segment Any Object via Bridged Large 3D-Language Model

Zhuoxu Huang

Mingqi Gao

Jungong Han

192

09 Sep 2025

Multimodal Referring Segmentation: A Survey

521

01 Aug 2025

TriCLIP-3D: A Unified Parameter-Efficient Framework for Tri-Modal 3D Visual Grounding based on CLIP

344

20 Jul 2025

MR-COSMO: Visual-Text Memory Recall and Direct CrOSs-MOdal Alignment Method for Query-Driven 3D Segmentation

293

26 Jun 2025

3DResT: A Strong Baseline for Semi-Supervised 3D Referring Expression Segmentation

300

17 Apr 2025

MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning SegmentationFoundations and Trends® in Signal Processing (FTSP), 2025

453

23 Mar 2025

Exploring 3D Reasoning-Driven Planning: From Implicit Human Intentions to Route-Aware Activity Planning

598

17 Mar 2025

LESS: Label-Efficient and Single-Stage Referring 3D SegmentationNeural Information Processing Systems (NeurIPS), 2024

479

17 Oct 2024

3D-GRES: Generalized 3D Referring Expression Segmentation

Jiayi Ji

334

30 Jul 2024

RefMask3D: Language-Guided Transformer for 3D Referring Segmentation

Shuting He

Henghui Ding

315

25 Jul 2024

SegPoint: Segment Any Point Cloud via Large Language Model

Henghui Ding

344

18 Jul 2024

Multi-branch Collaborative Learning Network for 3D Visual Grounding

Zhekai Lin

370

07 Jul 2024

A Unified Framework for 3D Scene Understanding

Xiang Bai

325

03 Jul 2024

A Survey on Text-guided 3D Visual Grounding: Elements, Recent Advances, and Future DirectionsIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2024

Wei Hu

426

09 Jun 2024

Image Captioning via Dynamic Path Customization

Jiayi Ji

Yongjian Wu

312

01 Jun 2024

Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model

Xiangtai Li

Ming-Hsuan Yang

476

27 May 2024

Cross-Modality Perturbation Synergy Attack for Person Re-identification

Yunpeng Gong

Zhiming Luo

Min Jiang

423

18 Jan 2024

Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation

Jiayi Ji

481

105

19 Dec 2023

OccuSeg: Occupancy-aware 3D Instance SegmentationComputer Vision and Pattern Recognition (CVPR), 2020

765

293

14 Mar 2020