Scaling Open-Vocabulary Image Segmentation with Image-Level Labels

22 December 2021

Papers citing "Scaling Open-Vocabulary Image Segmentation with Image-Level Labels"

50 / 292 papers shown

Title
Causal Prompt Calibration Guided Segment Anything Model for Open-Vocabulary Multi-Entity Segmentation Jingyao Wang Jianqi Zhang Wenwen Qiang Changwen Zheng VLM 27 0 0 10 May 2025
Visual Affordances: Enabling Robots to Understand Object Functionality Tommaso Apicella Alessio Xompero Andrea Cavallaro 39 0 0 08 May 2025
DeCLIP: Decoupled Learning for Open-Vocabulary Dense Perception Junjie Wang Bin Chen Yulin Li Bin Kang Y. Chen Zhuotao Tian VLM 38 0 0 07 May 2025
Show or Tell? A Benchmark To Evaluate Visual and Textual Prompts in Semantic Segmentation Gabriele Rosi Fabio Cermelli VLM 32 0 0 06 May 2025
Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models Yankai Jiang Peng Zhang D. Yang Yuan Tian Hai Lin X. Wang MedIm 67 0 0 05 May 2025
Cues3D: Unleashing the Power of Sole NeRF for Consistent and Unique Instances in Open-Vocabulary 3D Panoptic Segmentation Feng Xue Wenzhuang Xu Guofeng Zhong Anlong Minga N. Sebe 65 0 0 01 May 2025
Multimodal Perception for Goal-oriented Navigation: A Survey I-Tak Ieong Hao Tang LM&Ro LRM 29 0 0 22 Apr 2025
EmoSEM: Segment and Explain Emotion Stimuli in Visual Art Jing Zhang Dan Guo Zhangbin Li Meng Wang 29 0 0 20 Apr 2025
NVSMask3D: Hard Visual Prompting with Camera Pose Interpolation for 3D Open Vocabulary Instance Segmentation Junyuan Fang Zihan Wang Y. Zhang Shuzhe Wang Iaroslav Melekhov Juho Kannala VLM 40 0 0 20 Apr 2025
HAECcity: Open-Vocabulary Scene Understanding of City-Scale Point Clouds with Superpoint Graph Clustering Alexander Rusnak Frédéric Kaplan 3DPC 44 0 0 18 Apr 2025
FLOSS: Free Lunch in Open-vocabulary Semantic Segmentation Yasser Benigmim Mohammad Fahes Tuan-Hung Vu Andrei Bursuc Raoul de Charette VLM 32 0 0 14 Apr 2025
DSM: Building A Diverse Semantic Map for 3D Visual Grounding Qinghongbing Xie Zijian Liang Long Zeng 29 0 0 11 Apr 2025
FindAnything: Open-Vocabulary and Object-Centric Mapping for Robot Exploration in Any Environment Sebastián Barbas Laina Simon Boche Sotiris Papatheodorou Simon Schaefer Jaehyung Jung Stefan Leutenegger 44 0 0 11 Apr 2025
econSG: Efficient and Multi-view Consistent Open-Vocabulary 3D Semantic Gaussians Can Zhang G. Lee 3DV 50 0 0 08 Apr 2025
SemiDAViL: Semi-supervised Domain Adaptation with Vision-Language Guidance for Semantic Segmentation Hritam Basak Zhaozheng Yin VLM 31 0 0 08 Apr 2025
Zero-Shot 4D Lidar Panoptic Segmentation Yushan Zhang Aljosa Osep Laura Leal-Taixé Tim Meinhardt 3DPC 42 1 0 01 Apr 2025
Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis J. Huang Baoxiong Jia Y. Wang Ziyu Zhu Xiongkun Linghu Qing Li Song-Chun Zhu Siyuan Huang 75 3 0 28 Mar 2025
LPOSS: Label Propagation Over Patches and Pixels for Open-vocabulary Semantic Segmentation Vladan Stojnić Yannis Kalantidis Jirí Matas Giorgos Tolias VLM 46 0 0 25 Mar 2025
OpenLex3D: A New Evaluation Benchmark for Open-Vocabulary 3D Scene Representations Christina Kassab Sacha Morin Martin Buchner Matías Mattamala Kumaraditya Gupta Abhinav Valada Liam Paull Maurice F. Fallon 3DV ELM 46 0 0 25 Mar 2025
MLLM-For3D: Adapting Multimodal Large Language Model for 3D Reasoning Segmentation Jiaxin Huang Runnan Chen Ziwen Li Zhengqing Gao Xiao He Yandong Guo M. Gong Tongliang Liu LRM 51 0 0 23 Mar 2025
Generalized Few-shot 3D Point Cloud Segmentation with Vision-Language Model Zhaochong An Guolei Sun Yun Liu Runjia Li Junlin Han Ender Konukoglu Serge J. Belongie VLM 57 0 0 20 Mar 2025
Cross-Modal and Uncertainty-Aware Agglomeration for Open-Vocabulary 3D Scene Understanding Jinlong Li Cristiano Saltori Fabio Poiesi N. Sebe 100 0 0 20 Mar 2025
EgoSplat: Open-Vocabulary Egocentric Scene Understanding with Language Embedded 3D Gaussian Splatting Di Li Jie Feng Jiahao Chen Weisheng Dong Guanbin Li G. Shi Licheng Jiao 3DGS VLM 97 0 0 14 Mar 2025
SAS: Segment Any 3D Scene with Integrated 2D Priors Z. Li Jiahao Lu Jiacheng Deng Hanzhi Chang Lifan Wu Yanzhe Liang Tianzhu Zhang 55 0 0 11 Mar 2025
YOLOE: Real-Time Seeing Anything Ao Wang Lihao Liu Hui Chen Zijia Lin J. Han Guiguang Ding VLM ObjD 72 1 0 10 Mar 2025
VLScene: Vision-Language Guidance Distillation for Camera-Based 3D Semantic Scene Completion Meng Wang Huilong Pi Ruihui Li Yunchuan Qin Zhuo Tang KenLi Li 60 1 0 08 Mar 2025
Towards Universal Text-driven CT Image Segmentation Yuheng Li Yuxiang Lai Maria Thor Deborah Marshall Zachary Buchwald D. Yu Xiaofeng Yang MedIm VLM 50 2 0 08 Mar 2025
Vision-based 3D Semantic Scene Completion via Capture Dynamic Representations Meng Wang Fan Wu Yunchuan Qin Ruihui Li Zhuo Tang KenLi Li 3DPC 91 0 0 08 Mar 2025
Open-Vocabulary Semantic Part Segmentation of 3D Human Keito Suzuki Bang Du Girish Krishnan Kunyao Chen Runfa Li Truong Thao Nguyen 3DH VLM 94 0 0 27 Feb 2025
Laser: Efficient Language-Guided Segmentation in Neural Radiance Fields Xingyu Miao Haoran Duan Yang Bai Tejal Shah Jun Song Yang Long R. Ranjan Ling Shao 76 4 0 31 Jan 2025
3rd Workshop on Maritime Computer Vision (MaCVi) 2025: Challenge Results Benjamin Kiefer Lojze Žust Jon Muhovič Matej Kristan J. Pers ... Ashraf Saleem Ching-Heng Cheng Yu-Fan Lin Tzu-Yu Lin Chih-Chung Hsu 38 0 0 20 Jan 2025
DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data Yuanpeng Tu Xi Chen Ser-Nam Lim Hengshuang Zhao 33 0 0 03 Jan 2025
User Willingness-aware Sales Talk Dataset Asahi Hentona Jun Baba Shiki Sato Reina Akama 27 0 0 27 Dec 2024
LangSurf: Language-Embedded Surface Gaussians for 3D Scene Understanding Hao Li Roy Qin Zhengyu Zou Diqi He B. Li Bingquan Dai Dingewn Zhang J. Han 3DGS 40 1 0 23 Dec 2024
DINOv2 Meets Text: A Unified Framework for Image- and Pixel-Level Vision-Language Alignment Cijo Jose Théo Moutakanni Dahyun Kang Federico Baldassarre Timothée Darcet ... Maxime Oquab Oriane Siméoni Huy V. Vo Patrick Labatut Piotr Bojanowski CLIP VLM 88 6 0 20 Dec 2024
Incorporating Feature Pyramid Tokenization and Open Vocabulary Semantic Segmentation J. Zhang Li Zhang Shijian Li VLM 73 0 0 18 Dec 2024
RelationField: Relate Anything in Radiance Fields Sebastian Koch Johanna Wald Mirco Colosi Narunas Vaskevicius Pedro Hermosilla F. Tombari Timo Ropinski 109 1 0 18 Dec 2024
Open-World Panoptic Segmentation Matteo Sodano Federico Magistri Jens Behley Cyrill Stachniss VLM 66 0 0 17 Dec 2024
Towards Open-Vocabulary Video Semantic Segmentation X. Li Yun Liu Guolei Sun Min Wu Le Zhang Ce Zhu VLM VOS 85 1 0 12 Dec 2024
Occam's LGS: An Efficient Approach for Language Gaussian Splatting Jiahuan Cheng Jan-Nico Zaech Luc Van Gool Danda Pani Paudel 3DGS 79 0 0 02 Dec 2024
LMSeg: Unleashing the Power of Large-Scale Models for Open-Vocabulary Semantic Segmentation Huadong Tang Youpeng Zhao Y. Huang Min Xu Jun Wang Qiang Wu MLLM VLM 78 0 0 30 Nov 2024
ROSE: Revolutionizing Open-Set Dense Segmentation with Patch-Wise Perceptual Large Multimodal Model Kunyang Han Yibo Hu Mengxue Qu Hailin Shi Yao Zhao Y. X. Wei MLLM VLM 3DV 83 1 0 29 Nov 2024
Talking to DINO: Bridging Self-Supervised Vision Backbones with Language for Open-Vocabulary Segmentation Luca Barsellotti Lorenzo Bianchi Nicola Messina F. Carrara Marcella Cornia Lorenzo Baraldi Fabrizio Falchi Rita Cucchiara VLM 64 2 0 28 Nov 2024
A Study on Unsupervised Domain Adaptation for Semantic Segmentation in the Era of Vision-Language Models Manuel Schwonberg Claus Werner Hanno Gottschalk Carsten Meyer VLM 85 0 0 25 Nov 2024
Self-Calibrated CLIP for Training-Free Open-Vocabulary Segmentation Sule Bai Yong-Jin Liu Yifei Han Haoji Zhang Yansong Tang VLM 74 3 0 24 Nov 2024
XMask3D: Cross-modal Mask Reasoning for Open Vocabulary 3D Semantic Segmentation Ziyi Wang Y. Wang Xumin Yu Jie Zhou Jiwen Lu 67 0 0 20 Nov 2024
ITACLIP: Boosting Training-Free Semantic Segmentation with Image, Text, and Architectural Enhancements M. Arda Aydın Efe Mert Çırpar Elvin Abdinli Gözde B. Ünal Y. Sahin VLM 61 0 0 18 Nov 2024
Language-guided Hierarchical Fine-grained Image Forgery Detection and Localization Xiao Guo Xiaohong Liu I. Masi Xiaoming Liu 90 9 0 31 Oct 2024
Multimodality Helps Few-shot 3D Point Cloud Semantic Segmentation Zhaochong An Guolei Sun Yun Liu Runjia Li Min Wu Ming-Ming Cheng Ender Konukoglu Serge J. Belongie 64 4 0 29 Oct 2024
Scene Graph Generation with Role-Playing Large Language Models Guikun Chen Jin Li Wenguan Wang VLM 40 5 0 20 Oct 2024