PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes

8 May 2025

Abdelrahman Eldesokey

Peter Wonka

Gabriel J. Brostow

Sara Vicente

Guillermo Garcia-Hernando

DiffM

ArXiv (abs)PDF HTML

Papers citing "PlaceIt3D: Language-Guided Object Placement in Real 3D Scenes"

38 / 38 papers shown

Title
Out-of-Distribution Radar Detection in Compound Clutter and Thermal Noise through Variational Autoencoders Y A Rouzoumka E Terreaux C. Morisseau J. Ovarlez C. Ren 99 2 0 06 Mar 2025
SAMPart3D: Segment Any Part in 3D Objects Yanting Yang Yukun Huang Yu Guo Liangjun Lu Xiaoyang Wu Edmund Y. Lam Yan-Pei Cao Xihui Liu VLM 115 12 0 11 Nov 2024
VLA-3D: A Dataset for 3D Semantic Scene Understanding and Navigation Haochen Zhang Nader Zantout Pujith Kachana Zongyuan Wu Ji Zhang Wenshan Wang 3DV LM&Ro 86 6 0 05 Nov 2024
LLaVA-OneVision: Easy Visual Task Transfer Bo Li Yuanhan Zhang Dong Guo Renrui Zhang Feng Li Hao Zhang Kaichen Zhang Yanwei Li Ziwei Liu Chunyuan Li MLLM SyDa VLM 169 865 0 06 Aug 2024
LLaVA-NeXT-Interleave: Tackling Multi-image, Video, and 3D in Large Multimodal Models Feng Li Renrui Zhang Hao Zhang Yuanhan Zhang Bo Li Wei Li Zejun Ma Chunyuan Li MLLM VLM 132 233 0 10 Jul 2024
ScanReason: Empowering 3D Visual Grounding with Reasoning Capabilities Chenming Zhu Tai Wang Wenwei Zhang Kai Chen Xihui Liu ReLM LRM 112 24 0 01 Jul 2024
SpatialBot: Precise Spatial Understanding with Vision Language Models Wenxiao Cai Yaroslav Ponomarenko Jianhao Yuan Xiaoqi Li Wankou Yang Hao Dong Bo Zhao VLM 126 46 0 19 Jun 2024
RoboPoint: A Vision-Language Model for Spatial Affordance Prediction for Robotics Wentao Yuan Jiafei Duan Valts Blukis Wilbert Pumacay Ranjay Krishna Adithyavairavan Murali Arsalan Mousavian Dieter Fox LM&Ro 113 67 0 15 Jun 2024
3D-GRAND: A Million-Scale Dataset for 3D-LLMs with Better Grounding and Less Hallucination Jianing Yang Xuweiyi Chen Nikhil Madaan Madhavan Iyengar Shengyi Qian David Fouhey Joyce Chai 3DV 160 16 0 07 Jun 2024
Reason3D: Searching and Reasoning 3D Segmentation via Large Language Model Kuan-Chih Huang Xiangtai Li Lu Qi Shuicheng Yan Ming-Hsuan Yang LRM 170 12 0 27 May 2024
SpatialVLM: Endowing Vision-Language Models with Spatial Reasoning Capabilities Boyuan Chen Zhuo Xu Sean Kirmani Brian Ichter Danny Driess Pete Florence Dorsa Sadigh Leonidas Guibas Fei Xia LRM ReLM 91 270 0 22 Jan 2024
OCTO+: A Suite for Automatic Open-Vocabulary Object Placement in Mixed Reality Aditya Sharma Luke Yoffe Tobias Höllerer 64 8 0 17 Jan 2024
Seeing the Unseen: Visual Common Sense for Semantic Placement Ram Ramrakhya Aniruddha Kembhavi Dhruv Batra Z. Kira Kuo-Hao Zeng Luca Weihs VLM 106 6 0 15 Jan 2024
EmbodiedScan: A Holistic Multi-Modal 3D Perception Suite Towards Embodied AI Tai Wang Xiaohan Mao Chenming Zhu Runsen Xu Ruiyuan Lyu ... Tianfan Xue Xihui Liu Cewu Lu Dahua Lin Jiangmiao Pang LM&Ro 109 74 0 26 Dec 2023
LISA: Reasoning Segmentation via Large Language Model Xin Lai Zhuotao Tian Yukang Chen Yanwei Li Yuhui Yuan Shu Liu Jiaya Jia LM&Ro VLM MLLM LRM 167 463 0 01 Aug 2023
OpenMask3D: Open-Vocabulary 3D Instance Segmentation Ayca Takmaz Elisabetta Fedele R. Sumner Marc Pollefeys F. Tombari Francis Engelmann ISeg VLM 90 173 0 23 Jun 2023
Scalable 3D Captioning with Pretrained Models Tiange Luo C. Rockwell Honglak Lee Justin Johnson 116 160 0 12 Jun 2023
Visual Instruction Tuning Haotian Liu Chunyuan Li Qingyang Wu Yong Jae Lee SyDa VLM MLLM 579 4,942 0 17 Apr 2023
TopNet: Transformer-based Object Placement Network for Image Compositing Sijie Zhu Zhe Lin Scott D. Cohen Jason Kuen Zhifei Zhang Chen Chen ViT 50 17 0 06 Apr 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 447 4,666 0 30 Jan 2023
Objaverse: A Universe of Annotated 3D Objects Matt Deitke Dustin Schwenk Jordi Salvador Luca Weihs Oscar Michel Eli VanderBilt Ludwig Schmidt Kiana Ehsani Aniruddha Kembhavi Ali Farhadi 116 975 0 15 Dec 2022
ScanEnts3D: Exploiting Phrase-to-3D-Object Correspondences for Improved Visio-Linguistic Models in 3D Scenes Ahmed Abdelreheem Kyle Olszewski Hsin-Ying Lee Peter Wonka Panos Achlioptas 3DPC 107 28 0 12 Dec 2022
Superpoint Transformer for 3D Scene Instance Segmentation Jiahao Sun Chunmei Qing Junpeng Tan Xiangmin Xu 3DPC 107 110 0 28 Nov 2022
Mask3D: Mask Transformer for 3D Semantic Instance Segmentation Jonas Schult Francis Engelmann Alexander Hermans Or Litany Siyu Tang Bastian Leibe ISeg 119 182 0 06 Oct 2022
ScanQA: 3D Question Answering for Spatial Scene Understanding Daich Azuma Taiki Miyanishi Shuhei Kurita M. Kawanabe 104 208 0 20 Dec 2021
Point-BERT: Pre-training 3D Point Cloud Transformers with Masked Point Modeling Xumin Yu Lulu Tang Yongming Rao Tiejun Huang Jie Zhou Jiwen Lu 3DPC 173 687 0 29 Nov 2021
OPA: Object Placement Assessment Dataset Liu Liu Zhenchen Liu Bo Zhang Jiangtong Li Li Niu Qingyang Liu Liqing Zhang 93 29 0 05 Jul 2021
Scan2Cap: Context-aware Dense Captioning in RGB-D Scans Dave Zhenyu Chen A. Gholami Matthias Nießner Angel X. Chang 3DPC 178 176 0 03 Dec 2020
ScanRefer: 3D Object Localization in RGB-D Scans using Natural Language Dave Zhenyu Chen Angel X. Chang Matthias Nießner 3DPC 108 379 0 18 Dec 2019
4D Spatio-Temporal ConvNets: Minkowski Convolutional Neural Networks Chris Choy JunYoung Gwak Silvio Savarese 3DPC 211 1,801 0 18 Apr 2019
TextureNet: Consistent Local Parametrizations for Learning from High-Resolution Signals on Meshes Jingwei Huang Haotian Zhang L. Yi Thomas Funkhouser Matthias Nießner Leonidas Guibas 3DPC 3DV 97 118 0 30 Nov 2018
Indoor Scene Understanding in 2.5/3D for Autonomous Agents: A Survey Muzammal Naseer Salman H Khan Fatih Porikli 3DPC 3DV 78 101 0 09 Mar 2018
Open3D: A Modern Library for 3D Data Processing Qian-Yi Zhou Jaesik Park V. Koltun PINN AI4CE 80 1,632 0 30 Jan 2018
Large-scale Point Cloud Semantic Segmentation with Superpoint Graphs Loic Landrieu M. Simonovsky GNN 3DPC 203 1,259 0 27 Nov 2017
Generalised Dice overlap as a deep learning loss function for highly unbalanced segmentations Carole H Sudre Wenqi Li Tom Vercauteren Sébastien Ourselin M. Jorge Cardoso SSeg 145 2,158 0 11 Jul 2017
Attention Is All You Need Ashish Vaswani Noam M. Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan Gomez Lukasz Kaiser Illia Polosukhin 3DV 933 133,201 0 12 Jun 2017
PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space C. Qi L. Yi Hao Su Leonidas Guibas 3DPC 3DV 459 11,199 0 07 Jun 2017
ScanNet: Richly-annotated 3D Reconstructions of Indoor Scenes Angela Dai Angel X. Chang Manolis Savva Maciej Halber Thomas Funkhouser Matthias Nießner 3DPC 3DV 612 4,097 0 14 Feb 2017