TextPSG: Panoptic Scene Graph Generation from Textual Descriptions

TextPSG: Panoptic Scene Graph Generation from Textual Descriptions

10 October 2023

Mingyu Ding

Chuang Gan

Papers citing "TextPSG: Panoptic Scene Graph Generation from Textual Descriptions"

14 / 14 papers shown

Title
Relation-R1: Cognitive Chain-of-Thought Guided Reinforcement Learning for Unified Relational Comprehension Lin Li Wei Chen Jiahui Li L. Chen LRM 33 1 0 20 Apr 2025
Compile Scene Graphs with Reinforcement Learning Zuyao Chen Jinlin Wu Zhen Lei Marc Pollefeys Chang Wen Chen OffRL LRM 57 0 0 18 Apr 2025
SG-Tailor: Inter-Object Commonsense Relationship Reasoning for Scene Graph Manipulation Haoliang Shang Hanyu Wu Guangyao Zhai Boyang Sun Fangjinhua Wang F. Tombari Marc Pollefeys 51 0 0 23 Mar 2025
LLaVA-SpaceSGG: Visual Instruct Tuning for Open-vocabulary Scene Graph Generation with Enhanced Spatial Relations Mingjie Xu Mengyang Wu Yuzhi Zhao Jason Chun Lok Li Weifeng Ou LRM SyDa VLM 57 2 0 09 Dec 2024
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models Zijian Zhou Zheng Zhu Holger Caesar Miaojing Shi VLM 24 2 0 15 Jul 2024
4D Panoptic Scene Graph Generation Jingkang Yang Jun Cen Wenxuan Peng Shuai Liu Fangzhou Hong Xiangtai Li Kaiyang Zhou Qifeng Chen Ziwei Liu 32 13 0 16 May 2024
Clio: Real-time Task-Driven Open-Set 3D Scene Graphs Dominic Maggio Yun Chang Nathan Hughes Matthew Trang Dan Griffith Carlyn Dougherty Eric Cristofalo Lukas Schmid Luca Carlone 3DV 27 31 0 21 Apr 2024
The All-Seeing Project V2: Towards General Relation Comprehension of the Open World Weiyun Wang Yiming Ren Hao Luo Tiantong Li Chenxiang Yan ... Qingyun Li Lewei Lu Xizhou Zhu Yu Qiao Jifeng Dai MLLM 36 46 0 29 Feb 2024
ALF: Adaptive Label Finetuning for Scene Graph Generation Qishen Chen Jianzhi Liu Xinyu Lyu Lianli Gao Hengtao Shen Jingkuan Song 10 0 0 29 Dec 2023
GroupViT: Semantic Segmentation Emerges from Text Supervision Jiarui Xu Shalini De Mello Sifei Liu Wonmin Byeon Thomas Breuel Jan Kautz X. Wang ViT VLM 175 494 0 22 Feb 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 380 4,010 0 28 Jan 2022
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 273 845 0 17 Feb 2021
Explainable and Explicit Visual Reasoning over Scene Graphs Jiaxin Shi Hanwang Zhang Juan-Zi Li OCL 144 230 0 05 Dec 2018
Image Generation from Scene Graphs Justin Johnson Agrim Gupta Li Fei-Fei GNN 208 809 0 04 Apr 2018