Open Scene Understanding: Grounded Situation Recognition Meets Segment
Anything for Helping People with Visual Impairments

Open Scene Understanding: Grounded Situation Recognition Meets Segment Anything for Helping People with Visual Impairments

15 July 2023

Kailun Yang

Rainer Stiefelhagen

Papers citing "Open Scene Understanding: Grounded Situation Recognition Meets Segment Anything for Helping People with Visual Impairments"

6 / 6 papers shown

Title
Dynamic Scene Understanding from Vision-Language Representations Shahaf Pruss Morris Alper Hadar Averbuch-Elor OCL 89 0 0 20 Jan 2025
Computational Imaging for Machine Perception: Transferring Semantic Segmentation beyond Aberrations Qi Jiang Haowen Shi Shaohua Gao Jiaming Zhang Kailun Yang Lei Sun Huajian Ni Kaiwei Wang 16 5 0 21 Nov 2022
TransKD: Transformer Knowledge Distillation for Efficient Semantic Segmentation R. Liu Kailun Yang Alina Roitberg Jiaming Zhang Kunyu Peng Huayao Liu Yaonan Wang Rainer Stiefelhagen ViT 34 35 0 27 Feb 2022
GroupViT: Semantic Segmentation Emerges from Text Supervision Jiarui Xu Shalini De Mello Sifei Liu Wonmin Byeon Thomas Breuel Jan Kautz X. Wang ViT VLM 175 494 0 22 Feb 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong S. Hoi MLLM BDL VLM CLIP 385 4,010 0 28 Jan 2022
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions Wenhai Wang Enze Xie Xiang Li Deng-Ping Fan Kaitao Song Ding Liang Tong Lu Ping Luo Ling Shao ViT 263 3,538 0 24 Feb 2021