Language-driven Semantic Segmentation

10 January 2022

Boyi Li

Papers citing "Language-driven Semantic Segmentation"

37 / 87 papers shown

Title
TextPSG: Panoptic Scene Graph Generation from Textual Descriptions Chengyang Zhao Yikang Shen Zhenfang Chen Mingyu Ding Chuang Gan 40 15 0 10 Oct 2023
ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and Planning Yuanyi Zhong Alihusein Kuwajerwala Sacha Morin Krishna Murthy Jatavallabhula Bipasha Sen ... Celso Miguel de Melo Joshua B. Tenenbaum Antonio Torralba Florian Shkurti Liam Paull LM&Ro 27 166 0 28 Sep 2023
FLIP: Cross-domain Face Anti-spoofing with Language Guidance K. Srivatsan Muzammal Naseer Karthik Nandakumar CVBM 42 44 0 28 Sep 2023
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation Jiahao Xie Wei Li Xiangtai Li Ziwei Liu Yew-Soon Ong Chen Change Loy DiffM VLM 60 35 0 22 Sep 2023
LLM-Grounder: Open-Vocabulary 3D Visual Grounding with Large Language Model as an Agent Jianing Yang Xuweiyi Chen Shengyi Qian Nikhil Madaan Madhavan Iyengar David Fouhey Joyce Chai LM&Ro LLMAG 22 84 0 21 Sep 2023
Open-Vocabulary Affordance Detection using Knowledge Distillation and Text-Point Correlation Tuan V. Vo Minh Nhat Vu Baoru Huang Toan Tien Nguyen Ngan Le T. Vo Anh Nguyen 3DPC 19 9 0 19 Sep 2023
Bridging Zero-shot Object Navigation and Foundation Models through Pixel-Guided Navigation Skill Wenzhe Cai Siyuan Huang Guangran Cheng Yuxing Long Peng Gao Changyin Sun Hao Dong LM&Ro 19 41 0 19 Sep 2023
Blending-NeRF: Text-Driven Localized Editing in Neural Radiance Fields H. Song Seokhun Choi Hoseok Do Chul Lee Taehyeong Kim DiffM 24 24 0 23 Aug 2023
Hierarchical Open-vocabulary Universal Image Segmentation Xudong Wang Shufang Li Konstantinos Kallidromitis Yu Kato Kazuki Kozuka Trevor Darrell VLM OCL 30 36 0 03 Jul 2023
Towards AGI in Computer Vision: Lessons Learned from GPT and Large Language Models Lingxi Xie Longhui Wei Xiaopeng Zhang Kaifeng Bi Xiaotao Gu Jianlong Chang Qi Tian 29 7 0 14 Jun 2023
GeneCIS: A Benchmark for General Conditional Image Similarity S. Vaze Nicolas Carion Ishan Misra VLM DiffM 29 26 0 13 Jun 2023
DaTaSeg: Taming a Universal Multi-Dataset Multi-Task Segmentation Model Xiuye Gu Yin Cui Jonathan Huang Abdullah M. Rashwan X. Yang ... Golnaz Ghiasi Weicheng Kuo Huizhong Chen Liang-Chieh Chen David A. Ross ISeg 24 26 0 02 Jun 2023
Adapt and Align to Improve Zero-Shot Sketch-Based Image Retrieval Shiyin Dong Mingrui Zhu N. Wang Xinbo Gao VLM 27 3 0 09 May 2023
[CLS] Token is All You Need for Zero-Shot Semantic Segmentation Letian Wu Wenya Zhang Tengping Jiang Wankou Yang Xin Jin Wenjun Zeng VLM 19 4 0 13 Apr 2023
Prompt Pre-Training with Twenty-Thousand Classes for Open-Vocabulary Visual Recognition Shuhuai Ren Aston Zhang Yi Zhu Shuai Zhang Shuai Zheng Mu Li Alexander J. Smola Xu Sun VPVLM VLM 19 28 0 10 Apr 2023
RegionPLC: Regional Point-Language Contrastive Learning for Open-World 3D Scene Understanding Jihan Yang Runyu Ding Weipeng Deng Zhe Wang Xiaojuan Qi 10 61 0 03 Apr 2023
Weakly-Supervised Text-driven Contrastive Learning for Facial Behavior Understanding Xiang Zhang Taoyue Wang Xiaotian Li Huiyuan Yang L. Yin 29 9 0 31 Mar 2023
FreeSeg: Unified, Universal and Open-Vocabulary Image Segmentation Jie Qin Jie Wu Pengxiang Yan Ming Li Ren Yuxi ... Yitong Wang Rui Wang Shilei Wen X. Pan Xingang Wang SSeg VLM 16 87 0 30 Mar 2023
Blind Image Quality Assessment via Vision-Language Correspondence: A Multitask Learning Perspective Weixia Zhang Guangtao Zhai Ying Wei Xiaokang Yang Kede Ma VLM 27 169 0 27 Mar 2023
Semantic Image Segmentation: Two Decades of Research G. Csurka Riccardo Volpi Boris Chidlovskii 3DV 24 49 0 13 Feb 2023
SimCon Loss with Multiple Views for Text Supervised Semantic Segmentation Yash J. Patel Yusheng Xie Yi Zhu Srikar Appalaraju R. Manmatha 19 4 0 07 Feb 2023
Language-Driven Anchors for Zero-Shot Adversarial Robustness Xiao-Li Li Wei Emma Zhang Yining Liu Zhan Hu Bo-Wen Zhang Xiaolin Hu 26 8 0 30 Jan 2023
Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic Segmentation S. D. Dao Hengcan Shi Dinh Q. Phung Jianfei Cai VLM 34 0 0 18 Jan 2023
Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation Jianzong Wu Xiangtai Li Henghui Ding Xia Li Guangliang Cheng Yu Tong Chen Change Loy VLM 80 31 0 02 Jan 2023
CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection Jie Liu Yixiao Zhang Jieneng Chen Junfei Xiao Yongyi Lu Bennett A. Landman Yixuan Yuan Alan Yuille Yucheng Tang Zongwei Zhou VLM MedIm 39 193 0 02 Jan 2023
Fine-tuned CLIP Models are Efficient Video Learners H. Rasheed Muhammad Uzair Khattak Muhammad Maaz Salman Khan F. Khan CLIP VLM 17 148 0 06 Dec 2022
PØDA: Prompt-driven Zero-shot Domain Adaptation Mohammad Fahes Tuan-Hung Vu Andrei Bursuc Patrick Pérez Raoul de Charette VLM 36 45 0 06 Dec 2022
Peekaboo: Text to Image Diffusion Models are Zero-Shot Segmentors R. Burgert Kanchana Ranasinghe Xiang Li Michael S. Ryoo DiffM VLM 27 37 0 23 Nov 2022
Open-Vocabulary Semantic Segmentation with Mask-adapted CLIP Feng Liang Bichen Wu Xiaoliang Dai Kunpeng Li Yinan Zhao Hang Zhang Peizhao Zhang Peter Vajda Diana Marculescu CLIP VLM 32 432 0 09 Oct 2022
MaPLe: Multi-modal Prompt Learning Muhammad Uzair Khattak H. Rasheed Muhammad Maaz Salman Khan F. Khan VPVLM VLM 186 528 0 06 Oct 2022
SFNet: Faster and Accurate Semantic Segmentation via Semantic Flow Xiangtai Li Jiangning Zhang Yibo Yang Guangliang Cheng Kuiyuan Yang Yu Tong Dacheng Tao SSeg AI4TS 38 28 0 10 Jul 2022
Volumetric Disentanglement for 3D Scene Manipulation Sagie Benaim Frederik Warburg Peter Ebert Christensen Serge J. Belongie 17 15 0 06 Jun 2022
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language Andy Zeng Maria Attarian Brian Ichter K. Choromanski Adrian S. Wong ... Michael S. Ryoo Vikas Sindhwani Johnny Lee Vincent Vanhoucke Peter R. Florence ReLM LRM 10 569 0 01 Apr 2022
Scaling Open-Vocabulary Image Segmentation with Image-Level Labels Golnaz Ghiasi Xiuye Gu Yin Cui Tsung-Yi Lin VLM 30 370 0 22 Dec 2021
Few-Shot Segmentation Without Meta-Learning: A Good Transductive Inference Is All You Need? Malik Boudiaf H. Kervadec Imtiaz Masud Ziko Pablo Piantanida Ismail Ben Ayed Jose Dolz VLM 169 187 0 11 Dec 2020
Semantic Understanding of Scenes through the ADE20K Dataset Bolei Zhou Hang Zhao Xavier Puig Tete Xiao Sanja Fidler Adela Barriuso Antonio Torralba SSeg 249 1,821 0 18 Aug 2016
Efficient Estimation of Word Representations in Vector Space Tomáš Mikolov Kai Chen G. Corrado J. Dean 3DV 228 31,244 0 16 Jan 2013