COCONut: Modernizing COCO Segmentation

COCONut: Modernizing COCO Segmentation

12 April 2024

Peng Wang

Liang-Chieh Chen

Papers citing "COCONut: Modernizing COCO Segmentation"

16 / 16 papers shown

Title
Causal Prompt Calibration Guided Segment Anything Model for Open-Vocabulary Multi-Entity Segmentation Jingyao Wang Jianqi Zhang Wenwen Qiang Changwen Zheng VLM 16 0 0 10 May 2025
Visual Affordances: Enabling Robots to Understand Object Functionality Tommaso Apicella Alessio Xompero Andrea Cavallaro 34 0 0 08 May 2025
Semantic Library Adaptation: LoRA Retrieval and Fusion for Open-Vocabulary Semantic Segmentation Reza Qorbani Gianluca Villani Theodoros Panagiotakopoulos Marc Botet Colomer Linus Harenstam-Nielsen ... Pier Luigi Dovesi Jussi Karlgren Daniel Cremers F. Tombari Matteo Poggi VLM 37 0 0 27 Mar 2025
Dynamic Relation Inference via Verb Embeddings Omri Suissa Muhiim Ali Ariana Azarbal Hui Shen Shekhar Pradhan 38 0 0 17 Mar 2025
OmniBooth: Learning Latent Control for Image Synthesis with Multi-modal Instruction Leheng Li Weichao Qiu Xu Yan Jing He Kaiqiang Zhou Yingjie Cai Qing Lian Bingbing Liu Ying-Cong Chen SyDa DiffM 31 1 0 07 Oct 2024
From COCO to COCO-FP: A Deep Dive into Background False Positives for COCO Detectors Longfei Liu Wen Guo S. Huang Cheng Li Xi Shen ObjD 18 0 0 12 Sep 2024
Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model Haobo Yuan Xiangtai Li Lu Qi Tao Zhang Ming Yang Shuicheng Yan Chen Change Loy VLM 27 10 0 27 Jun 2024
ViTamin: Designing Scalable Vision Models in the Vision-Language Era Jienneg Chen Qihang Yu Xiaohui Shen Alan L. Yuille Liang-Chieh Chen 3DV VLM 28 24 0 02 Apr 2024
Subobject-level Image Tokenization Delong Chen Samuel Cahyawijaya Jianfeng Liu Baoyuan Wang Pascale Fung VLM OCL 46 6 0 22 Feb 2024
Benchmarking a Benchmark: How Reliable is MS-COCO? Eric Zimmermann Justin Szeto Jerome Pasquero Frederic Ratle 19 3 0 05 Nov 2023
CFR-ICL: Cascade-Forward Refinement with Iterative Click Loss for Interactive Image Segmentation Shoukun Sun Min Xian Fei Xu L. Capriotti Tiankai Yao 27 11 0 09 Mar 2023
Open-Vocabulary Panoptic Segmentation with Text-to-Image Diffusion Models Jiarui Xu Sifei Liu Arash Vahdat Wonmin Byeon Xiaolong Wang Shalini De Mello VLM 198 318 0 08 Mar 2023
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language Models Junnan Li Dongxu Li Silvio Savarese Steven C. H. Hoi VLM MLLM 244 4,186 0 30 Jan 2023
DensePose: Dense Human Pose Estimation In The Wild R. Güler Natalia Neverova Iasonas Kokkinos 3DH 164 1,371 0 01 Feb 2018
Feature Pyramid Networks for Object Detection Tsung-Yi Lin Piotr Dollár Ross B. Girshick Kaiming He Bharath Hariharan Serge J. Belongie ObjD 154 3,574 0 09 Dec 2016
ImageNet Large Scale Visual Recognition Challenge Olga Russakovsky Jia Deng Hao Su J. Krause S. Satheesh ... A. Karpathy A. Khosla Michael S. Bernstein Alexander C. Berg Li Fei-Fei VLM ObjD 279 39,083 0 01 Sep 2014