ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model

ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model

29 November 2023

Papers citing "ShapeGPT: 3D Shape Generation with A Unified Multi-modal Language Model"

11 / 11 papers shown

Title
Distilling Multi-view Diffusion Models into 3D Generators Hao Qin Luyuan Chen Ming Kong Mengxu Lu Qiang Zhu 3DGS 64 0 0 01 Apr 2025
Hunyuan3D 2.0: Scaling Diffusion Models for High Resolution Textured 3D Assets Generation Zibo Zhao Zeqiang Lai Qingxiang Lin Yunfei Zhao Haolin Liu ... Jingwei Huang Chunchao Guo Jie Jiang Jingwei Huang Chunchao Guo 113 21 0 21 Jan 2025
VP-LLM: Text-Driven 3D Volume Completion with Large Language Models through Patchification Jianmeng Liu Yichen Liu Yuyao Zhang Zeyuan Meng Yu-Wing Tai Chi-Keung Tang 49 0 0 08 Jun 2024
LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding, Reasoning, and Planning Sijin Chen Xin Chen C. Zhang Mingsheng Li Gang Yu Hao Fei Hongyuan Zhu Jiayuan Fan Tao Chen MLLM 26 79 0 30 Nov 2023
3D VR Sketch Guided 3D Shape Prototyping and Exploration Ling Luo Pinaki Nath Chowdhury Tao Xiang Yi-Zhe Song Yulia Gryaditskaya 37 12 0 19 Jun 2023
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality Qinghao Ye Haiyang Xu Guohai Xu Jiabo Ye Ming Yan ... Junfeng Tian Qiang Qi Ji Zhang Feiyan Huang Jingren Zhou VLM MLLM 208 900 0 27 Apr 2023
$PC^2$ : Projection-Conditioned Point Cloud Diffusion for Single-Image 3D Reconstruction Luke Melas-Kyriazi Christian Rupprecht Andrea Vedaldi DiffM 56 80 0 21 Feb 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 278 4,244 0 30 Jan 2023
Training language models to follow instructions with human feedback Long Ouyang Jeff Wu Xu Jiang Diogo Almeida Carroll L. Wainwright ... Amanda Askell Peter Welinder Paul Christiano Jan Leike Ryan J. Lowe OSLM ALM 319 11,953 0 04 Mar 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 392 4,137 0 28 Jan 2022
VideoCLIP: Contrastive Pre-training for Zero-shot Video-Text Understanding Hu Xu Gargi Ghosh Po-Yao (Bernie) Huang Dmytro Okhonko Armen Aghajanyan Florian Metze Luke Zettlemoyer Florian Metze Luke Zettlemoyer Christoph Feichtenhofer CLIP VLM 259 558 0 28 Sep 2021