Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP

9 October 2022

Papers citing "Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP"

50 / 331 papers shown

Title
Transferable and Principled Efficiency for Open-Vocabulary Segmentation Jingxuan Xu Wuyang Chen Yao-Min Zhao Yunchao Wei VLM 31 0 0 11 Apr 2024
O2V-Mapping: Online Open-Vocabulary Mapping with Neural Implicit Representation Muer Tie Julong Wei Zhengjun Wang Ke Wu Shansuai Yuan Kaizhao Zhang Jie Jia Jieru Zhao Zhongxue Gan Wenchao Ding 31 7 0 10 Apr 2024
Training-Free Open-Vocabulary Segmentation with Offline Diffusion-Augmented Prototype Generation Luca Barsellotti Roberto Amoroso Marcella Cornia Lorenzo Baraldi Rita Cucchiara VLM DiffM 29 13 0 09 Apr 2024
Audio-Visual Generalized Zero-Shot Learning using Pre-Trained Large Multi-Modal Models David Kurzendörfer Otniel-Bogdan Mercea A. Sophia Koepke Zeynep Akata VLM CLIP 14 2 0 09 Apr 2024
GHOST: Grounded Human Motion Generation with Open Vocabulary Scene-and-Text Contexts Z. '. Milacski Koichiro Niinuma Ryosuke Kawamura Fernando de la Torre László A. Jeni 21 1 0 08 Apr 2024
CoReS: Orchestrating the Dance of Reasoning and Segmentation Xiaoyi Bao Siyang Sun Shuailei Ma Kecheng Zheng Yuxin Guo Guosheng Zhao Yun Zheng Xingang Wang LRM 28 6 0 08 Apr 2024
AlignZeg: Mitigating Objective Misalignment for Zero-shot Semantic Segmentation Jiannan Ge Lingxi Xie Hongtao Xie Pandeng Li Xiaopeng Zhang Yongdong Zhang Qi Tian VLM 16 3 0 08 Apr 2024
Image-Text Co-Decomposition for Text-Supervised Semantic Segmentation Ji-Jia Wu Andy Chia-Hao Chang Chieh-Yu Chuang Chun-Pei Chen Yu-Lun Liu Min-Hung Chen Hou-Ning Hu Yung-Yu Chuang Yen-Yu Lin VLM 33 9 0 05 Apr 2024
Language-Guided Instance-Aware Domain-Adaptive Panoptic Segmentation Elham Amin Mansour Ozan Unal Suman Saha Benjamin Bejar Luc Van Gool 29 1 0 04 Apr 2024
OpenNeRF: Open Set 3D Neural Scene Segmentation with Pixel-Wise Features and Rendered Novel Views Francis Engelmann Fabian Manhardt Michael Niemeyer Keisuke Tateno Marc Pollefeys Federico Tombari VLM 59 32 1 04 Apr 2024
Segment Any 3D Object with Language Seungjun Lee Yuyang Zhao Gim Hee Lee 31 1 0 02 Apr 2024
OVFoodSeg: Elevating Open-Vocabulary Food Image Segmentation via Image-Informed Textual Representation Xiongwei Wu Sicheng Yu Ee-Peng Lim Chong-Wah Ngo VLM 22 2 0 01 Apr 2024
GOV-NeSF: Generalizable Open-Vocabulary Neural Semantic Fields Yunsong Wang Hanlin Chen Gim Hee Lee 24 5 0 01 Apr 2024
TTD: Text-Tag Self-Distillation Enhancing Image-Text Alignment in CLIP to Alleviate Single Tag Bias Sang-Kee Jo Soohyun Ryu Sungyub Kim Eunho Yang Kyungsu Kim 24 1 0 30 Mar 2024
Image-to-Image Matching via Foundation Models: A New Perspective for Open-Vocabulary Semantic Segmentation Yuan Wang Rui Sun Naisong Luo Yuwen Pan Tianzhu Zhang VLM 38 9 0 30 Mar 2024
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models Barbara Toniella Corradini Mustafa Shukor Paul Couairon Guillaume Couairon Franco Scarselli Matthieu Cord DiffM VLM 38 4 0 29 Mar 2024
Lift3D: Zero-Shot Lifting of Any 2D Vision Model to 3D Mukund Varma Peihao Wang Zhiwen Fan Zhangyang Wang Hao Su R. Ramamoorthi VLM 32 8 0 27 Mar 2024
Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation Abdelrhman Werby Chen Huang M. Büchner Abhinav Valada Wolfram Burgard 36 63 0 26 Mar 2024
Task2Box: Box Embeddings for Modeling Asymmetric Task Relationships Rangel Daroya Aaron Sun Subhransu Maji 25 0 0 25 Mar 2024
Knowledge-Enhanced Dual-stream Zero-shot Composed Image Retrieval Yuchen Suo Fan Ma Linchao Zhu Yi Yang 27 18 0 24 Mar 2024
Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting Jun Guo Xiaojian Ma Yue Fan Huaping Liu Qing Li 3DGS 36 26 0 22 Mar 2024
Transfer CLIP for Generalizable Image Denoising Junting Cheng Dong Liang Shan Tan VLM 20 12 0 22 Mar 2024
Open-Vocabulary Attention Maps with Token Optimization for Semantic Segmentation in Diffusion Models Pablo Marcos-Manchón Roberto Alcover-Couso Juan C. Sanmiguel Jose M. Martínez VLM 37 18 0 21 Mar 2024
OTSeg: Multi-prompt Sinkhorn Attention for Zero-Shot Semantic Segmentation Kwanyoung Kim Y. Oh Jong Chul Ye VLM 33 7 0 21 Mar 2024
Empowering Segmentation Ability to Multi-modal Large Language Models Yuqi Yang Peng-Tao Jiang Jing Wang Hao Zhang Kai Zhao Jinwei Chen Bo-wen Li LRM VLM 19 3 0 21 Mar 2024
Semantics from Space: Satellite-Guided Thermal Semantic Segmentation Annotation for Aerial Field Robots Connor T. Lee Saraswati Soedarmadji Matthew O. Anderson Anthony J. Clark Soon-Jo Chung 28 5 0 21 Mar 2024
Better Call SAL: Towards Learning to Segment Anything in Lidar Aljovsa Ovsep Tim Meinhardt Francesco Ferroni Neehar Peri Deva Ramanan Laura Leal-Taixé VLM 14 15 0 19 Mar 2024
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation Wenqi Zhu Jiale Cao Jin Xie Shuangming Yang Yanwei Pang VLM CLIP 37 1 0 19 Mar 2024
OV9D: Open-Vocabulary Category-Level 9D Object Pose and Size Estimation Junhao Cai Yisheng He Weihao Yuan Siyu Zhu Zilong Dong Liefeng Bo Qifeng Chen DiffM 24 8 0 19 Mar 2024
OpenOcc: Open Vocabulary 3D Scene Reconstruction via Occupancy Representation Haochen Jiang Yueming Xu Yihan Zeng Hang Xu Wei Zhang Jianfeng Feng Li Zhang 16 1 0 18 Mar 2024
TAG: Guidance-free Open-Vocabulary Semantic Segmentation Yasufumi Kawano Yoshimitsu Aoki VLM 30 2 0 17 Mar 2024
MaskDiffusion: Exploiting Pre-trained Diffusion Models for Semantic Segmentation Yasufumi Kawano Yoshimitsu Aoki DiffM 19 4 0 17 Mar 2024
N2F2: Hierarchical Scene Understanding with Nested Neural Feature Fields Yash Bhalgat Iro Laina João F. Henriques Andrew Zisserman Andrea Vedaldi 38 14 0 16 Mar 2024
Lifelong LERF: Local 3D Semantic Inventory Monitoring Using FogROS2 Adam Rashid C. Kim J. Kerr Letian Fu Kush Hari ... Michael Wang Christian Juette Nan Tian Liu Ren Kenneth Y. Goldberg 30 6 0 15 Mar 2024
PosSAM: Panoptic Open-vocabulary Segment Anything VS Vibashan Shubhankar Borse Hyojin Park Debasmit Das Vishal M. Patel Munawar Hayat Fatih Porikli VLM MLLM 23 6 0 14 Mar 2024
Renovating Names in Open-Vocabulary Segmentation Benchmarks Haiwen Huang Songyou Peng Dan Zhang Andreas Geiger VLM 27 3 0 14 Mar 2024
CART: Caltech Aerial RGB-Thermal Dataset in the Wild Connor T. Lee Matthew O. Anderson Nikhil Raganathan Xingxing Zuo Kevin Do Georgia Gkioxari Soon-Jo Chung 35 7 0 13 Mar 2024
TaskCLIP: Extend Large Vision-Language Model for Task Oriented Object Detection Hanning Chen Wenjun Huang Yang Ni Sanggeon Yun Fei Wen Hugo Latapie Mohsen Imani ObjD MLLM VLM 32 16 0 12 Mar 2024
PointSeg: A Training-Free Paradigm for 3D Scene Segmentation via Foundation Models Qingdong He Jinlong Peng Zhengkai Jiang Xiaobin Hu Jiangning Zhang Qiang Nie Yabiao Wang Chengjie Wang 3DPC VLM 29 2 0 11 Mar 2024
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors Anindya Mondal Sauradip Nag Xiatian Zhu Anjan Dutta 25 3 0 08 Mar 2024
$A$^{3}$lign-DFER: Pioneering Comprehensive Dynamic Affective Alignment for Dynamic Facial Expression Recognition with CLIP$ A $^{3}$ lign-DFER: Pioneering Comprehensive Dynamic Affective Alignment for Dynamic Facial Expression Recognition with CLIP Zeng Tao Yan Wang Junxiong Lin Haoran Wang Xinji Mai ... Ziheng Zhou Shaoqi Yan Qing Zhao Liyuan Han Wenqiang Zhang 25 11 0 07 Mar 2024
Multi-Grained Cross-modal Alignment for Learning Open-vocabulary Semantic Segmentation from Text Supervision Yajie Liu Pu Ge Qingjie Liu Di Huang 52 2 0 06 Mar 2024
Benchmarking Segmentation Models with Mask-Preserved Attribute Editing Zijin Yin Kongming Liang Bing Li Zhanyu Ma Jun Guo VLM 33 2 0 02 Mar 2024
Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model Huan Ma Yan Zhu Changqing Zhang Peilin Zhao Baoyuan Wu Long-Kai Huang Qinghua Hu Bing Wu VLM 55 1 0 01 Mar 2024
LLMBind: A Unified Modality-Task Integration Framework Bin Zhu Munan Ning Peng Jin Bin Lin Jinfa Huang ... Junwu Zhang Zhenyu Tang Mingjun Pan Xing Zhou Li-ming Yuan MLLM 24 6 0 22 Feb 2024
HaLo-NeRF: Learning Geometry-Guided Semantics for Exploring Unconstrained Photo Collections Chen Dudai Morris Alper Hana Bezalel Rana Hanocka Itai Lang Hadar Averbuch-Elor 17 2 0 14 Feb 2024
Open-Vocabulary Segmentation with Unpaired Mask-Text Supervision Zhaoqing Wang Xiaobo Xia Ziye Chen Xiao He Yandong Guo Mingming Gong Tongliang Liu VLM 11 10 0 14 Feb 2024
KVQ: Kwai Video Quality Assessment for Short-form Videos Yiting Lu Xin Li Yajing Pei Kun Yuan Qizhi Xie Yunpeng Qu Ming-hui Sun Chao Zhou Zhibo Chen 10 16 0 11 Feb 2024
OV-NeRF: Open-vocabulary Neural Radiance Fields with Vision and Language Foundation Models for 3D Semantic Understanding Guibiao Liao Kaichen Zhou Zhenyu Bao Kanglin Liu Qing Li VLM 11 19 0 07 Feb 2024
Repositioning the Subject within Image Yikai Wang Chenjie Cao Ke Fan Qiaole Dong Yifan Li Xiangyang Xue Yanwei Fu DiffM 24 1 0 30 Jan 2024