Communities
Connect sessions
AI calendar
Organizations
Join Slack
Contact Sales

Terms and Conditions

Twitter GitHub LinkedIn Bluesky Youtube

© 2026 ResearchTrend.AI, All rights reserved.

Home
Papers
2407.11213
Cited By

OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal
Models

OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models

15 July 2024

Zijian Zhou

ArXiv (abs)PDF HTML HuggingFace (3 upvotes)Github (46★)

Papers citing "OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models"

8 / 8 papers shown

ScenarioCLIP: Pretrained Transferable Visual Language Models and Action-Genome Dataset for Natural Scene Analysis

ScenarioCLIP: Pretrained Transferable Visual Language Models and Action-Genome Dataset for Natural Scene Analysis

209

0

0

25 Nov 2025

Interaction-Centric Knowledge Infusion and Transfer for Open-Vocabulary Scene Graph Generation

Interaction-Centric Knowledge Infusion and Transfer for Open-Vocabulary Scene Graph Generation

175

0

0

08 Nov 2025

Explaining multimodal LLMs via intra-modal token interactions

Explaining multimodal LLMs via intra-modal token interactions

220

1

0

26 Sep 2025

Designing Memory-Augmented AR Agents for Spatiotemporal Reasoning in Personalized Task Assistance

Designing Memory-Augmented AR Agents for Spatiotemporal Reasoning in Personalized Task Assistance

193

0

0

12 Aug 2025

Hallucinate, Ground, Repeat: A Framework for Generalized Visual Relationship Detection

Hallucinate, Ground, Repeat: A Framework for Generalized Visual Relationship Detection

Shanmukha Vellamcheti

Sathyanarayanan N. Aakur

303

0

0

06 Jun 2025

Open-Vocabulary Functional 3D Scene Graphs for Real-World Indoor Spaces

Open-Vocabulary Functional 3D Scene Graphs for Real-World Indoor SpacesComputer Vision and Pattern Recognition (CVPR), 2025

Chenyangguang Zhang

Alexandros Delitzas

Fangjinhua Wang

Francis Engelmann

466

38

0

24 Mar 2025

REF-VLM: Triplet-Based Referring Paradigm for Unified Visual Decoding

REF-VLM: Triplet-Based Referring Paradigm for Unified Visual Decoding

286

0

0

10 Mar 2025

TextPSG: Panoptic Scene Graph Generation from Textual Descriptions

TextPSG: Panoptic Scene Graph Generation from Textual DescriptionsIEEE International Conference on Computer Vision (ICCV), 2023

Mingyu Ding

Chuang Gan

473

24

0

10 Oct 2023

Page 1 of 1