v1v2 (latest)

LVIS: A Dataset for Large Vocabulary Instance Segmentation

Computer Vision and Pattern Recognition (CVPR), 2019

8 August 2019

Piotr Dollár

Papers citing "LVIS: A Dataset for Large Vocabulary Instance Segmentation"

50 / 1,055 papers shown

Title
Towards Open World Detection: A Survey Andrei-Stefan Bulzan Cosmin Cernazanu-Glavan ObjD VLM 195 0 0 22 Aug 2025
Towards PerSense++: Advancing Training-Free Personalized Instance Segmentation in Dense Images Muhammad Ibraheem Siddiqui Muhammad Umer Sheikh Hassan Abid Kevin Henry M. H. Khan VLM MDE 125 0 0 20 Aug 2025
A Guide for Manual Annotation of Scientific Imagery: How to Prepare for Large Projects Azim Ahmadzadeh Rohan Adhyapak Armin Iraji Kartik Chaurasiya V Aparna P. Martens VLM 80 0 0 20 Aug 2025
RISE: Enhancing VLM Image Annotation with Self-Supervised Reasoning Suhang Hu Wei Hu Yuhang Su Fan Zhang ReLM LRM VLM 232 0 0 17 Aug 2025
Generalized Decoupled Learning for Enhancing Open-Vocabulary Dense Perception Junjie Wang Keyu Chen Yulin Li Bin Chen Hengshuang Zhao Xiaojuan Qi Zhuotao Tian CLIP VLM 110 1 0 15 Aug 2025
MolmoAct: Action Reasoning Models that can Reason in Space Jason Lee Jiafei Duan Haoquan Fang Yuquan Deng Shuo Liu ... Karen Farley Eli VanderBilt Ali Farhadi Dieter Fox Ranjay Krishna LM&Ro LRM 385 46 0 11 Aug 2025
A Study of the Framework and Real-World Applications of Language Embedding for 3D Scene Understanding Mahmoud Chick Zaouali Todd Charter Yehor Karpichev Brandon Haworth Homayoun Najjjaran 3DGS 260 0 0 07 Aug 2025
Composed Object Retrieval: Object-level Retrieval via Composed Expressions Tong Wang Guanyu Yang Nian Liu Zongyan Han Jinxing Zhou Salman Khan Fahad Shahbaz Khan 139 0 0 06 Aug 2025
DOMR: Establishing Cross-View Segmentation via Dense Object Matching Jitong Liao Yulu Gao Shaofei Huang Jialin Gao Jie Lei Ronghua Liang Si Liu 157 1 0 06 Aug 2025
X-SAM: From Segment Anything to Any Segmentation Hao Wang Limeng Qiao Zequn Jie Zhijian Huang Chengjian Feng Qingfang Zheng Lin Ma X. Lan Xiaodan Liang VLM 109 5 0 06 Aug 2025
Enhancing Object Discovery for Unsupervised Instance Segmentation and Object Detection Xingyu Feng Hebei Gao Hong Li 128 0 0 04 Aug 2025
OpenMap: Instruction Grounding via Open-Vocabulary Visual-Language Mapping Danyang Li Zenghui Yang Guangpeng Qi Songtao Pang Guangyong Shang Qiang Ma Zheng Yang 125 0 0 03 Aug 2025
ODOV: Towards Open-Domain Open-Vocabulary Object Detection Yupeng Zhang Ruize Han Fangnan Zhou Song Wang Wei Feng Liang Wan ObjD VLM 145 0 0 02 Aug 2025
ROVI: A VLM-LLM Re-Captioned Dataset for Open-Vocabulary Instance-Grounded Text-to-Image Generation Cihang Peng Qiming Hou Zhong Ren Kun Zhou ObjD 138 0 0 01 Aug 2025
YOLO-Count: Differentiable Object Counting for Text-to-Image Generation Guanning Zeng Xiang Zhang Zirui Wang Haiyang Xu Zeyuan Chen Bingnan Li Zhuowen Tu 138 5 0 01 Aug 2025
Modality-Aware Feature Matching: A Comprehensive Review of Single- and Cross-Modality Techniques Weide Liu Wei Zhou Jun Liu Ping Hu Jun Cheng Jungong Han Weisi Lin 3DV 179 3 0 30 Jul 2025
Object Recognition Datasets and Challenges: A Review Aria Salari Abtin Djavadifar Xiangrui Liu Homayoun Najjaran ObjD 162 69 0 30 Jul 2025
From Waveforms to Pixels: A Survey on Audio-Visual Segmentation Jia Li Yapeng Tian VOS 190 2 0 29 Jul 2025
YOLO for Knowledge Extraction from Vehicle Images: A Baseline Study Saraa Al-Saddik Manna Elizabeth Philip Ali Haidar 76 0 0 25 Jul 2025
OVFact: Measuring and Improving Open-Vocabulary Factuality for Long Caption Models Monika Wysoczańska Shyamal Buch Anurag Arnab Cordelia Schmid HILM 160 0 0 25 Jul 2025
LMM-Det: Make Large Multimodal Models Excel in Object Detection Jincheng Li Chunyu Xie Ji Ao Dawei Leng Yuhui Yin MLLM ObjD VLM 259 6 0 24 Jul 2025
Dynamic-DINO: Fine-Grained Mixture of Experts Tuning for Real-time Open-Vocabulary Object Detection Yehao Lu Minghe Weng Zekang Xiao Rui Jiang Wei Su Guangcong Zheng Ping Lu Xi Li MoE ObjD 128 1 0 23 Jul 2025
Discovering and using Spelke segments R. Venkatesh Klemen Kotar Lilian Naing Chen Seungwoo Kim Luca Thomas Wheeler ... Wanhee Lee Honglin Chen Daniel M. Bear Stefan Stojanov Daniel L. K. Yamins 129 0 0 21 Jul 2025
HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation Weihuang Lin Yiwei Ma Xiaoshuai Sun Shuting He Jiayi Ji Liujuan Cao Rongrong Ji 114 1 0 17 Jul 2025
Test-Time Canonicalization by Foundation Models for Robust Perception Utkarsh Singhal Ryan Feng Stella X. Yu Atul Prakash 225 2 0 14 Jul 2025
Advancing Multimodal LLMs by Large-Scale 3D Visual Instruction Dataset Generation Liu He Xiao Zeng Yizhi Song Albert Y. C. Chen Lu Xia Shashwat Verma Sankalp Dayal Min Sun Cheng-Hao Kuo Daniel G. Aliaga VGen 214 0 0 11 Jul 2025
Object Retrieval for Visual Question Answering with Outside Knowledge Shichao Kan Yuhai Deng Yixiong Liang Lihui Cen Zhe Qu Linna Zhang Zhihai He Yigang Cen 223 0 0 01 Jul 2025
Spurious-Aware Prototype Refinement for Reliable Out-of-Distribution Detection Reihaneh Zohrabi Hosein Hasani M. Baghshah Anna Rohrbach Marcus Rohrbach M. Rohban OODD 288 1 0 30 Jun 2025
PicoSAM2: Low-Latency Segmentation In-Sensor for Edge Vision Applications Pietro Bonazzi Nicola Farronato Stefan Zihlmann Haotong Qin Michele Magno VLM 247 2 0 23 Jun 2025
FocalClick-XL: Towards Unified and High-quality Interactive Segmentation Xi Chen Hengshuang Zhao 173 0 0 17 Jun 2025
A Comprehensive Survey on Video Scene Parsing:Advances, Challenges, and Prospects Guohuan Xie Syed Ariff Syed Hesham Wenya Guo Bing Li Ming-Ming Cheng Guolei Sun Yun-Hai Liu 138 1 0 16 Jun 2025
AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models Zheda Mai A. Chowdhury Zihe Wang Sooyoung Jeon Jingyan Bai Jiacheng Hou Jihyung Kil Wei-Lun Chao CoGe 215 4 0 10 Jun 2025
CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation Arnav Yayavaram Siddharth Yayavaram Simran Khanuja Michael Saxon Graham Neubig 196 0 0 10 Jun 2025
ATAS: Any-to-Any Self-Distillation for Enhanced Open-Vocabulary Dense Prediction Juan Yeo S. Cha Jiwoo Song Hyunbin Jin Taesup Kim VLM 116 1 0 10 Jun 2025
Synthetic Visual GenomeComputer Vision and Pattern Recognition (CVPR), 2025 J. S. Park Zixian Ma Linjie Li Chenhao Zheng Cheng-Yu Hsieh ... Quan Kong Norimasa Kobori Ali Farhadi Yejin Choi Ranjay Krishna 180 0 0 09 Jun 2025
Gen-n-Val: Agentic Image Data Generation and Validation Jing-En Huang I-Sheng Fang Tzuhsuan Huang Chih-Yu Wang Jun-Cheng Chen VLM 290 0 0 05 Jun 2025
Refer to Any Segmentation Mask Group With Vision-Language Prompts Shengcao Cao Zijun Wei Jason Kuen Kangning Liu Lingzhi Zhang Jiuxiang Gu HyunJoon Jung Liang-Yan Gui Yu Wang VLM 310 2 0 05 Jun 2025
Auto-Labeling Data for Object Detection Brent A. Griffin Manushree Gangwar Jacob Sela Jason J. Corso ObjD VLM 222 0 0 03 Jun 2025
GaRA-SAM: Robustifying Segment Anything Model with Gated-Rank Adaptation Sohyun Lee Yeho Kwon Lukas Hoyer Suha Kwak 245 0 0 03 Jun 2025
unMORE: Unsupervised Multi-Object Segmentation via Center-Boundary Reasoning Yafei Yang Zihui Zhang Bo Yang OCL 258 1 0 02 Jun 2025
Common Inpainted Objects In-N-Out of Context Tianze Yang Tyson Jordan Ninghao Liu Jin Sun 163 0 0 31 May 2025
Test-time Vocabulary Adaptation for Language-driven Object DetectionInternational Conference on Information Photonics (ICIP), 2025 Mingxuan Liu Tyler L. Hayes Massimiliano Mancini Elisa Ricci Riccardo Volpi G. Csurka ObjD TTA VLM 173 2 0 31 May 2025
Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control Danfeng li Hui Zhang Sheng Wang Jiacheng Li Zuxuan Wu DiffM VLM 322 0 0 31 May 2025
DINO-R1: Incentivizing Reasoning Capability in Vision Foundation Models Chenbin Pan Wenbin He Zhengzhong Tu Liu Ren LRM VLM 455 2 0 29 May 2025
Roboflow100-VL: A Multi-Domain Object Detection Benchmark for Vision-Language Models Peter Robicheaux Matvei Popov Anish Madan Isaac Robinson Joseph Nelson Deva Ramanan Neehar Peri ObjD VLM 324 14 0 27 May 2025
Active-O3: Empowering Multimodal Large Language Models with Active Perception via GRPO Huanyi Zheng Hao Zhong Canyu Zhao Zongze Du Zheng Huang ... Hao Chen Cheng Zou Jingdong Chen Ming-Hsuan Yang Chunhua Shen LRM 315 18 0 27 May 2025
Open-Det: An Efficient Learning Framework for Open-Ended Detection Guiping Cao Tao Wang Wenjian Huang X. Lan Jianguo Zhang Shihong Deng ObjD VLM 161 1 0 27 May 2025
SANSA: Unleashing the Hidden Semantics in SAM2 for Few-Shot Segmentation Claudia Cuttano Gabriele Trivigno Giuseppe Averta Carlo Masone VLM 207 0 0 27 May 2025
What Changed? Detecting and Evaluating Instruction-Guided Image Edits with Multimodal Large Language Models Lorenzo Baraldi Davide Bucciarelli Federico Betti Marcella Cornia Lorenzo Baraldi Andrii Zadaianchuk Rita Cucchiara 341 2 0 26 May 2025
FruitNeRF++: A Generalized Multi-Fruit Counting Method Utilizing Contrastive Learning and Neural Radiance Fields Lukas Meyer Andrei-Timotei Ardelean Tim Weyrich Marc Stamminger 183 3 0 26 May 2025

All Papers

LVIS: A Dataset for Large Vocabulary Instance Segmentation

Papers citing "LVIS: A Dataset for Large Vocabulary Instance Segmentation"