SegPoint: Segment Any Point Cloud via Large Language Model

18 July 2024

Henghui Ding

Papers citing "SegPoint: Segment Any Point Cloud via Large Language Model"

21 / 21 papers shown

Title
3DResT: A Strong Baseline for Semi-Supervised 3D Referring Expression Segmentation Wenxin Chen Mengxue Qu Weitai Kang Yan Yan Yao Zhao Yunchao Wei 32 0 0 17 Apr 2025
PVUW 2025 Challenge Report: Advances in Pixel-level Understanding of Complex Videos in the Wild Henghui Ding Chang Liu Nikhila Ravi Shuting He Y. Wei ... Haobo Yuan X. Li Tao Zhang Lu Qi Ming Yang 21 0 0 15 Apr 2025
NuGrounding: A Multi-View 3D Visual Grounding Framework in Autonomous Driving Fuhao Li Huan Jin Bin-Bin Gao Liaoyuan Fan Lihui Jiang Long Zeng 58 0 0 28 Mar 2025
Semantic Consistent Language Gaussian Splatting for Point-Level Open-vocabulary Querying Hairong Yin Huangying Zhan Yi Tian Xu Raymond A. Yeh 36 0 0 27 Mar 2025
Text-Driven 3D Lidar Place Recognition for Autonomous Driving Tianyi Shang Zhenyu Li Pengjie Xu ZhaoJun Deng Ruirui Zhang 32 0 0 23 Mar 2025
MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation Jiaxin Huang Runnan Chen Ziwen Li Zhengqing Gao Xiao He Yandong Guo M. Gong Tongliang Liu LRM 44 0 0 23 Mar 2025
Exploring 3D Activity Reasoning and Planning: From Implicit Human Intentions to Route-Aware Planning Xueying Jiang Wenhao Li Xiaoqin Zhang Ling Shao Shijian Lu LRM 35 0 0 17 Mar 2025
MICAS: Multi-grained In-Context Adaptive Sampling for 3D Point Cloud Processing Feifei Shao Ping Liu Zhao Wang Yawei Luo Hongwei Wang Jun Xiao 3DPC 59 0 0 25 Nov 2024
PAVLM: Advancing Point Cloud based Affordance Understanding Via Vision-Language Model Shang-Ching Liu Van-Nhiem Tran Wenkai Chen Wei-Lun Cheng Yen-Lin Huang I-Bin Liao Yung-Hui Li Jianwei Zhang 18 0 0 15 Oct 2024
Grounding 3D Scene Affordance From Egocentric Interactions Cuiyu Liu Wei Zhai Yuhang Yang Hongchen Luo Sen Liang Yang Cao Zheng-Jun Zha 13 1 0 29 Sep 2024
A Survey of Multimodal-Guided Image Editing with Text-to-Image Diffusion Models Xincheng Shuai Henghui Ding Xingjun Ma Rongcheng Tu Yu-Gang Jiang Dacheng Tao 21 16 0 20 Jun 2024
Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation Shuting He Henghui Ding VOS 19 23 0 04 Apr 2024
GPT4Point: A Unified Framework for Point-Language Understanding and Generation Zhangyang Qi Ye Fang Zeyi Sun Xiaoyang Wu Tong Wu Jiaqi Wang Dahua Lin Hengshuang Zhao MLLM 69 35 0 05 Dec 2023
LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Models Hao Zhang Hongyang Li Feng Li Tianhe Ren Xueyan Zou ... Shijia Huang Jianfeng Gao Lei Zhang Chun-yue Li Jianwei Yang 87 68 0 05 Dec 2023
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality Qinghao Ye Haiyang Xu Guohai Xu Jiabo Ye Ming Yan ... Junfeng Tian Qiang Qi Ji Zhang Feiyan Huang Jingren Zhou VLM MLLM 198 883 0 27 Apr 2023
Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models Jiarui Xu Sifei Liu Arash Vahdat Wonmin Byeon Xiaolong Wang Shalini De Mello VLM 198 318 0 08 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
VLT: Vision-Language Transformer and Query Generation for Referring Segmentation Henghui Ding Chang Liu Suchen Wang Xudong Jiang 54 86 0 28 Oct 2022
Mask3D: Mask Transformer for 3D Semantic Instance Segmentation Jonas Schult Francis Engelmann Alexander Hermans Or Litany Siyu Tang Bastian Leibe ISeg 47 164 0 06 Oct 2022
EDA: Explicit Text-Decoupling and Dense Alignment for 3D Visual Grounding Yanmin Wu Xinhua Cheng Renrui Zhang Zesen Cheng Jian Zhang 36 62 0 29 Sep 2022
PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation C. Qi Hao Su Kaichun Mo Leonidas J. Guibas 3DH 3DPC 3DV PINN 210 13,886 0 02 Dec 2016