Open-Vocabulary Object Detection Using Captions

20 November 2020

Derek Hao Hu

Papers citing "Open-Vocabulary Object Detection Using Captions"

50 / 317 papers shown

Title
Active Open-Vocabulary Recognition: Let Intelligent Moving Mitigate CLIP Limitations Lei Fan Jianxiong Zhou Xiaoying Xing Ying Wu VLM 24 3 0 28 Nov 2023
Griffon: Spelling out All Object Locations at Any Granularity with Large Language Models Yufei Zhan Yousong Zhu Zhiyang Chen Fan Yang E. Goles Jinqiao Wang ObjD 47 14 0 24 Nov 2023
Point, Segment and Count: A Generalized Framework for Object Counting Zhizhong Huang Mingliang Dai Yi Zhang Junping Zhang Hongming Shan 31 16 0 21 Nov 2023
Toward Open Vocabulary Aerial Object Detection with CLIP-Activated Student-Teacher Learning Yan Li Weiwei Guo Xue Yang Ning Liao Dunyun He Jiaqi Zhou Wenxian Yu ObjD VLM 22 7 0 20 Nov 2023
Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention Zuyao Chen Jinlin Wu Zhen Lei Zhaoxiang Zhang Changwen Chen 23 11 0 18 Nov 2023
Open-Vocabulary Video Anomaly Detection Peng Wu Xuerong Zhou Guansong Pang Yujia Sun Jing Liu Peng Wang Yanning Zhang VLM 32 21 0 13 Nov 2023
Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion Hao Zhou Tiancheng Shen Xu Yang Hai Huang Xiangtai Li Lu Qi Ming-Hsuan Yang 79 12 0 06 Nov 2023
Vision-Language Interpreter for Robot Task Planning Keisuke Shirai C. C. Beltran-Hernandez Masashi Hamaya Atsushi Hashimoto Shohei Tanaka Kento Kawaharazuka Kazutoshi Tanaka Yoshitaka Ushiku Shinsuke Mori LM&Ro 13 26 0 02 Nov 2023
Re-Scoring Using Image-Language Similarity for Few-Shot Object Detection Min Jae Jung S. Han Joohee Kim 23 13 0 01 Nov 2023
LP-OVOD: Open-Vocabulary Object Detection by Linear Probing Chau Pham Truong Vu Khoi Duc Minh Nguyen ObjD 22 16 0 26 Oct 2023
CoDet: Co-Occurrence Guided Region-Word Alignment for Open-Vocabulary Object Detection Chuofan Ma Yi-Xin Jiang Xin Wen Zehuan Yuan Xiaojuan Qi ObjD VLM 18 48 0 25 Oct 2023
OV-VG: A Benchmark for Open-Vocabulary Visual Grounding Chunlei Wang Wenquan Feng Xiangtai Li Guangliang Cheng Shuchang Lyu Binghao Liu Lijiang Chen Qi Zhao ObjD VLM 21 9 0 22 Oct 2023
Learning from Rich Semantics and Coarse Locations for Long-tailed Object Detection Lingchen Meng Xiyang Dai Jianwei Yang Dongdong Chen Yinpeng Chen Mengchen Liu Yi-Ling Chen Zuxuan Wu Lu Yuan Yu-Gang Jiang 10 6 0 18 Oct 2023
Bongard-OpenWorld: Few-Shot Reasoning for Free-form Visual Concepts in the Real World Rujie Wu Xiaojian Ma Zhenliang Zhang Wei Wang Qing Li Song-Chun Zhu Yizhou Wang LRM VLM 19 7 0 16 Oct 2023
Zero-Shot Open-Vocabulary Tracking with Large Pre-Trained Models Wen-Hsuan Chu Adam W. Harley P. Tokmakov Achal Dave Leonidas J. Guibas Katerina Fragkiadaki VLM 18 7 0 10 Oct 2023
CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection Yang Cao Yihan Zeng Hang Xu Dan Xu 3DPC ObjD 8 33 0 04 Oct 2023
MarineDet: Towards Open-Marine Object Detection Haixin Liang Ziqiang Zheng Zeyu Ma Sai-Kit Yeung 20 4 0 03 Oct 2023
CLIPSelf: Vision Transformer Distills Itself for Open-Vocabulary Dense Prediction Size Wu Wenwei Zhang Lumin Xu Sheng Jin Xiangtai Li Wentao Liu Chen Change Loy CLIP VLM 24 68 0 02 Oct 2023
DST-Det: Simple Dynamic Self-Training for Open-Vocabulary Object Detection Shilin Xu Xiangtai Li Size Wu Wenwei Zhang Yunhai Tong Chen Change Loy ObjD VLM 16 14 0 02 Oct 2023
Region-centric Image-Language Pretraining for Open-Vocabulary Detection Dahun Kim A. Angelova Weicheng Kuo ObjD VLM 9 3 0 29 Sep 2023
Semi-Supervised Domain Generalization for Object Detection via Language-Guided Feature Alignment Sina Malakouti Adriana Kovashka ObjD 22 2 0 24 Sep 2023
MosaicFusion: Diffusion Models as Data Augmenters for Large Vocabulary Instance Segmentation Jiahao Xie Wei Li Xiangtai Li Ziwei Liu Yew-Soon Ong Chen Change Loy DiffM VLM 60 35 0 22 Sep 2023
Detect Everything with Few Examples Xinyu Zhang Yuting Wang Abdeslam Boularias ObjD VLM 21 13 0 22 Sep 2023
Object2Scene: Putting Objects in Context for Open-Vocabulary 3D Detection Chenming Zhu Wenwei Zhang Tai Wang Xihui Liu Kai-xiang Chen 3DPC 37 18 0 18 Sep 2023
Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping Adam Rashid Satvik Sharma C. Kim J. Kerr L. Chen Angjoo Kanazawa Ken Goldberg 50 84 0 14 Sep 2023
From Text to Mask: Localizing Entities Using the Attention of Text-to-Image Diffusion Models Changming Xiao Qi Yang Feng Zhou Changshui Zhang 25 17 0 08 Sep 2023
EdaDet: Open-Vocabulary Object Detection Using Early Dense Alignment Cheng Shi Sibei Yang VLM ObjD 30 38 0 03 Sep 2023
Contrastive Grouping with Transformer for Referring Image Segmentation Jiajin Tang Ge Zheng Cheng Shi Sibei Yang ViT 16 37 0 02 Sep 2023
Contrastive Feature Masking Open-Vocabulary Vision Transformer Dahun Kim A. Angelova Weicheng Kuo ObjD VLM 21 27 0 02 Sep 2023
What Makes Good Open-Vocabulary Detector: A Disassembling Perspective Jincheng Li Chunyu Xie Xiaoyu Wu Bin Wang Dawei Leng VLM ObjD 12 3 0 01 Sep 2023
Towards Addressing the Misalignment of Object Proposal Evaluation for Vision-Language Tasks via Semantic Grounding Joshua Forster Feinglass Yezhou Yang 19 2 0 01 Sep 2023
Exploring Multi-Modal Contextual Knowledge for Open-Vocabulary Object Detection Yifan Xu Mengdan Zhang Xiaoshan Yang Changsheng Xu ObjD 19 5 0 30 Aug 2023
Opening the Vocabulary of Egocentric Actions Dibyadip Chatterjee Fadime Sener Shugao Ma Angela Yao VLM 22 16 0 22 Aug 2023
ViLLA: Fine-Grained Vision-Language Representation Learning from Real-World Data M. Varma Jean-Benoit Delbrouck Sarah Hooper Akshay S. Chaudhari C. Langlotz VLM CoGe 40 5 0 22 Aug 2023
Open-vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Models Dohwan Ko Ji Soo Lee M. Choi Jaewon Chu Jihwan Park Hyunwoo J. Kim 20 5 0 18 Aug 2023
Taming Self-Training for Open-Vocabulary Object Detection Shiyu Zhao S. Schulter Long Zhao Zhixing Zhang Vijay Kumar B.G Yumin Suh Manmohan Chandraker Dimitris N. Metaxas VLM ObjD 30 12 0 11 Aug 2023
Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP Qihang Yu Ju He XueQing Deng Xiaohui Shen Liang-Chieh Chen VLM CLIP 26 135 0 04 Aug 2023
Lowis3D: Language-Driven Open-World Instance-Level 3D Scene Understanding Runyu Ding Jihan Yang Chuhui Xue Wenqing Zhang Song Bai Xiaojuan Qi 3DV VLM 16 28 0 01 Aug 2023
Described Object Detection: Liberating Object Detection with Flexible Expressions Chi Xie Zhao Zhang YiXuan Wu Feng Zhu Rui Zhao Shuang Liang ObjD 32 30 0 24 Jul 2023
A Survey on Open-Vocabulary Detection and Segmentation: Past, Present, and Future Chaoyang Zhu Long Chen ObjD VLM 24 32 0 18 Jul 2023
Unified Open-Vocabulary Dense Visual Prediction Hengcan Shi Munawar Hayat Jianfei Cai ObjD VLM 36 19 0 17 Jul 2023
Open-Vocabulary Object Detection via Scene Graph Discovery Hengcan Shi Munawar Hayat Jianfei Cai ObjD 16 12 0 07 Jul 2023
Towards Open Vocabulary Learning: A Survey Jianzong Wu Xiangtai Li Shilin Xu Haobo Yuan Henghui Ding ... Jiangning Zhang Yu Tong Xudong Jiang Bernard Ghanem Dacheng Tao ObjD VLM 27 134 0 28 Jun 2023
Explainable Multimodal Emotion Recognition Zheng Lian Haiyang Sun Licai Sun Hao Gu Zhuofan Wen ... Shan Liang Ya Li Jiangyan Yi B. Liu Jianhua Tao MLLM 8 6 0 27 Jun 2023
Primitive Generation and Semantic-related Alignment for Universal Zero-Shot Segmentation Shuting He Henghui Ding Wei Jiang VLM 70 35 0 19 Jun 2023
World-to-Words: Grounded Open Vocabulary Acquisition through Fast Mapping in Vision-Language Models Ziqiao Ma Jiayi Pan J. Chai ObjD VLM 21 8 0 14 Jun 2023
Augmenting Zero-Shot Detection Training with Image Labels Katharina Kornmeier Ulla Scheler P. Herrmann ObjD VLM 11 1 0 12 Jun 2023
Read, look and detect: Bounding box annotation from image-caption pairs E. Sanchez ObjD 17 0 0 09 Jun 2023
Multi-Modal Classifiers for Open-Vocabulary Object Detection Prannay Kaul Weidi Xie Andrew Zisserman ObjD VLM MLLM 14 47 0 08 Jun 2023
ScaleDet: A Scalable Multi-Dataset Object Detector Yanbei Chen Manchen Wang Abhay Mittal Zhenlin Xu Paolo Favaro Joseph Tighe Davide Modolo ObjD 6 19 0 08 Jun 2023