What You Perceive Is What You Conceive: A Cognition-Inspired Framework for Open Vocabulary Image Segmentation

26 May 2025

Papers citing "What You Perceive Is What You Conceive: A Cognition-Inspired Framework for Open Vocabulary Image Segmentation"

30 / 30 papers shown

Title
Qwen2.5-VL Technical Report S. Bai Keqin Chen Xuejing Liu Jialin Wang Wenbin Ge ... Zesen Cheng Hang Zhang Zhibo Yang Haiyang Xu Junyang Lin VLM 142 430 0 20 Feb 2025
Open-Vocabulary Semantic Segmentation with Image Embedding Balancing Xiangheng Shan Dongyue Wu Guilin Zhu Yuanjie Shao Nong Sang Changxin Gao VLM 36 17 0 14 Jun 2024
TAG: Guidance-free Open-Vocabulary Semantic Segmentation Yasufumi Kawano Yoshimitsu Aoki VLM 34 4 0 17 Mar 2024
Qwen Technical Report Jinze Bai Shuai Bai Yunfei Chu Zeyu Cui Kai Dang ... Zhenru Zhang Chang Zhou Jingren Zhou Xiaohuan Zhou Tianhang Zhu OSLM 155 1,756 0 28 Sep 2023
Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP Qihang Yu Ju He XueQing Deng Xiaohui Shen Liang-Chieh Chen VLM CLIP 64 144 0 04 Aug 2023
DINOv2: Learning Robust Visual Features without Supervision Maxime Oquab Timothée Darcet Théo Moutakanni Huy Q. Vo Marc Szafraniec ... Hervé Jégou Julien Mairal Patrick Labatut Armand Joulin Piotr Bojanowski VLM CLIP SSL 244 3,205 0 14 Apr 2023
FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation Jie Qin Jie Wu Pengxiang Yan Ming Li Ren Yuxi ... Yitong Wang Rui Wang Shilei Wen X. Pan Xingang Wang SSeg VLM 42 91 0 30 Mar 2023
You Only Segment Once: Towards Real-Time Panoptic Segmentation Jie Hu Linyan Huang Tianhe Ren Shengchuan Zhang Rongrong Ji Liujuan Cao SSeg 69 56 0 26 Mar 2023
CAT-Seg: Cost Aggregation for Open-Vocabulary Semantic Segmentation Seokju Cho Heeseong Shin Sung‐Jin Hong Anurag Arnab Paul Hongsuck Seo Seung Wook Kim VLM 58 108 0 21 Mar 2023
Open-vocabulary Panoptic Segmentation with Embedding Modulation Xi Chen Shuang Li Ser-Nam Lim Antonio Torralba Hengshuang Zhao VLM 44 32 0 20 Mar 2023
Side Adapter Network for Open-Vocabulary Semantic Segmentation Mengde Xu Zheng Zhang Fangyun Wei Han Hu Xiang Bai VLM 44 259 0 23 Feb 2023
Generalized Decoding for Pixel, Image, and Language Xueyan Zou Zi-Yi Dou Jianwei Yang Zhe Gan Linjie Li ... Lu Yuan Nanyun Peng Lijuan Wang Yong Jae Lee Jianfeng Gao VLM MLLM ObjD 49 247 0 21 Dec 2022
Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP Feng Liang Bichen Wu Xiaoliang Dai Kunpeng Li Yinan Zhao Hang Zhang Peizhao Zhang Peter Vajda Diana Marculescu CLIP VLM 64 443 0 09 Oct 2022
Open-Vocabulary Universal Image Segmentation with MaskCLIP Zheng Ding Jieke Wang Zhuowen Tu CLIP ISeg VLM 61 89 0 18 Aug 2022
ReSTR: Convolution-free Referring Image Segmentation Using Transformers N. Kim Dongwon Kim Cuiling Lan Wenjun Zeng Suha Kwak 148 139 0 31 Mar 2022
GroupViT: Semantic Segmentation Emerges from Text Supervision Jiarui Xu Shalini De Mello Sifei Liu Wonmin Byeon Thomas Breuel Jan Kautz Xinyu Wang ViT VLM 276 517 0 22 Feb 2022
BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation Junnan Li Dongxu Li Caiming Xiong Guosheng Lin MLLM BDL VLM CLIP 438 4,283 0 28 Jan 2022
Masked-attention Mask Transformer for Universal Image Segmentation Bowen Cheng Ishan Misra Alex Schwing Alexander Kirillov Rohit Girdhar ISeg 183 2,315 0 02 Dec 2021
Panoptic SegFormer: Delving Deeper into Panoptic Segmentation with Transformers Zhiqi Li Wenhai Wang Enze Xie Zhiding Yu Anima Anandkumar J. Álvarez Ping Luo Tong Lu ViT 124 137 0 08 Sep 2021
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 381 1,103 0 17 Feb 2021
Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision Chao Jia Yinfei Yang Ye Xia Yi-Ting Chen Zarana Parekh Hieu H. Pham Quoc V. Le Yun-hsuan Sung Zhen Li Tom Duerig VLM CLIP 390 3,778 0 11 Feb 2021
MaX-DeepLab: End-to-End Panoptic Segmentation with Mask Transformers Huiyu Wang Yukun Zhu Hartwig Adam Alan Yuille Liang-Chieh Chen ViT 88 528 0 01 Dec 2020
Panoptic-DeepLab Bowen Cheng Maxwell D. Collins Yukun Zhu Ting Liu Thomas S. Huang Hartwig Adam Liang-Chieh Chen 42 610 0 10 Oct 2019
Zero-Shot Semantic Segmentation Max Bucher Tuan-Hung Vu Matthieu Cord P. Pérez VLM SSeg 115 319 0 03 Jun 2019
MAttNet: Modular Attention Network for Referring Expression Comprehension Licheng Yu Zhe Lin Xiaohui Shen Jimei Yang Xin Lu Joey Tianyi Zhou Tamara L. Berg ObjD 94 822 0 24 Jan 2018
Panoptic Segmentation Alexander Kirillov Kaiming He Ross B. Girshick Carsten Rother Piotr Dollár 90 1,425 0 03 Jan 2018
Mask R-CNN Kaiming He Georgia Gkioxari Piotr Dollár Ross B. Girshick ObjD 300 27,018 0 20 Mar 2017
The Cityscapes Dataset for Semantic Urban Scene Understanding Marius Cordts Mohamed Omran Sebastian Ramos Timo Rehfeld Markus Enzweiler Rodrigo Benenson Uwe Franke Stefan Roth Bernt Schiele 669 11,540 0 06 Apr 2016
Segmentation from Natural Language Expressions Ronghang Hu Marcus Rohrbach Trevor Darrell VLM EgoV 58 432 0 20 Mar 2016
Microsoft COCO: Common Objects in Context Nayeon Lee Michael Maire Serge J. Belongie Lubomir Bourdev Ross B. Girshick James Hays Pietro Perona Deva Ramanan C. L. Zitnick Piotr Dollár ObjD 252 43,290 0 01 May 2014