v1v2 (latest)

Open-Vocabulary DETR with Conditional Matching

European Conference on Computer Vision (ECCV), 2022

22 March 2022

Papers citing "Open-Vocabulary DETR with Conditional Matching"

50 / 182 papers shown

Title
OVT-B: A New Large-Scale Benchmark for Open-Vocabulary Multi-Object TrackingNeural Information Processing Systems (NeurIPS), 2024 Haiji Liang Ruize Han VLM 273 4 0 23 Oct 2024
LOBG:Less Overfitting for Better Generalization in Vision-Language Model Chenhao Ding Xinyuan Gao Songlin Dong Yuhang He Qiang Wang Alex C. Kot Yihong Gong VLM 204 1 0 14 Oct 2024
Boosting Open-Vocabulary Object Detection by Handling Background Samples Ruizhe Zeng Lu Zhang Xu Yang Zhiyong Liu VLM ObjD 156 1 0 11 Oct 2024
End-to-end Open-vocabulary Video Visual Relationship Detection using Multi-modal PromptingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024 Yongqi Wang Xinxiao Wu Shuo Yang Jiebo Luo 880 2 0 19 Sep 2024
From COCO to COCO-FP: A Deep Dive into Background False Positives for COCO Detectors Longfei Liu Wen Guo Shijie Huang Cheng Li Xi Shen ObjD 199 0 0 12 Sep 2024
More Pictures Say More: Visual Intersection Network for Open Set Object Detection Bingcheng Dong Yuning Ding Jinrong Zhang Sifan Zhang Shenglan Liu ObjD 142 0 0 26 Aug 2024
OpenNav: Efficient Open Vocabulary 3D Object Detection for Smart Wheelchair Navigation Muhammad Rameez Ur Rahman Piero Simonetto Anna Polato Francesco Pasti Luca Tonin Sebastiano Vascon 3DPC 133 1 0 25 Aug 2024
Visual Grounding for Object-Level Generalization in Reinforcement LearningEuropean Conference on Computer Vision (ECCV), 2024 Haobin Jiang Zongqing Lu LM&Ro 177 3 0 04 Aug 2024
Dynamic Object Queries for Transformer-based Incremental Object Detection Jichuan Zhang Wei Li Shuang Cheng Yali Li Shengjin Wang 183 5 0 31 Jul 2024
MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection Kuo Wang Lechao Cheng Weikai Chen Pingping Zhang Liang Lin Fan Zhou Guanbin Li VLM ObjD 178 7 0 31 Jul 2024
Open Vocabulary 3D Scene Understanding via Geometry Guided Self-Distillation Pengfei Wang Yuxi Wang Shuai Li Zhaoxiang Zhang Zhen Lei Lei Zhang 194 10 0 18 Jul 2024
LaMI-DETR: Open-Vocabulary Detection with Language Model Instruction Penghui Du Yu Wang Yifan Sun Luting Wang Yue Liao Qiang Chen Errui Ding Yan Wang Jingdong Wang Si Liu VLM ObjD 213 11 0 16 Jul 2024
OpenPSG: Open-set Panoptic Scene Graph Generation via Large Multimodal Models Zijian Zhou Zheng Zhu Holger Caesar Miaojing Shi VLM 166 10 0 15 Jul 2024
Quantized Prompt for Efficient Generalization of Vision-Language Models Tianxiang Hao Xiaohan Ding Juexiao Feng Yuhong Yang Hui Chen Guiguang Ding VLM MQ 206 9 0 15 Jul 2024
Global-Local Collaborative Inference with LLM for Lidar-Based Open-Vocabulary Detection Xingyu Peng Yan Bai Chen Gao Lirong Yang Fei Xia Beipeng Mu Xiaofei Wang Si Liu ObjD 183 7 0 12 Jul 2024
Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Cross-Regularization Jinlong Li Zequn Jie Elisa Ricci Lin Ma Andrii Zadaianchuk VLM 284 1 0 11 Jul 2024
Open-Event Procedure Planning in Instructional Videos Yilu Wu Hanlin Wang Jing Wang Limin Wang 219 1 0 06 Jul 2024
Open-Vocabulary X-ray Prohibited Item Detection via Fine-tuning CLIP Shuyang Lin Tong Jia Hao Wang Bowen Ma Mingyuan Li Dongyue Chen VLM ObjD 163 2 0 16 Jun 2024
OVMR: Open-Vocabulary Recognition with Multi-Modal ReferencesComputer Vision and Pattern Recognition (CVPR), 2024 Zehong Ma Shiliang Zhang Longhui Wei Qi Tian VLM 246 3 0 07 Jun 2024
Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation Mohamed El Amine Boudjoghra Angela Dai Jean Lahoud Hisham Cholakkal Rao Muhammad Anwer Salman Khan Fahad Shahbaz Khan VLM ISeg 583 18 0 04 Jun 2024
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection Jiaming Li Jiacheng Zhang Jichang Li Ge Li Si Liu Liang Lin Guanbin Li ObjD VLM 286 26 0 01 Jun 2024
CapeX: Category-Agnostic Pose Estimation from Textual Point Explanation M. Rusanovsky Or Hirschorn S. Avidan 197 8 0 01 Jun 2024
RTGen: Generating Region-Text Pairs for Open-Vocabulary Object Detection Fangyi Chen Han Zhang Zhantao Yang Hao Chen Kai Hu Marios Savvides ObjD VLM 170 7 0 30 May 2024
OV-DQUO: Open-Vocabulary DETR with Denoising Text Query Training and Open-World Unknown Objects Supervision Junjie Wang Bin Chen Bin Kang Yulin Li Yichi Chen Weizhi Xian Huifeng Chang VLM ObjD 178 15 0 28 May 2024
Diagnosing the Compositional Knowledge of Vision Language Models from a Game-Theoretic View Jin Wang Shichao Dong Yapeng Zhu Kelu Yao Weidong Zhao Chao Li Ping Luo CoGe LRM 225 5 0 27 May 2024
LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding Haoyu Zhao Wenhang Ge Ying-Cong Chen ObjD MLLM VLM 225 7 0 27 May 2024
Unsupervised Image Prior via Prompt Learning and CLIP Semantic Guidance for Low-Light Image Enhancement Igor Morawski Kai He Shusil Dangi Winston H. Hsu VLM 234 9 0 19 May 2024
Open-Vocabulary Spatio-Temporal Action Detection Tao Wu Shuqiu Ge Jie Qin Gangshan Wu Limin Wang ObjD 135 9 0 17 May 2024
SHiNe: Semantic Hierarchy Nexus for Open-vocabulary Object DetectionComputer Vision and Pattern Recognition (CVPR), 2024 Mingxuan Liu Tyler L. Hayes Elisa Ricci G. Csurka Riccardo Volpi ObjD 233 8 0 16 May 2024
Open-Vocabulary Object Detection via Neighboring Region Attention AlignmentEngineering applications of artificial intelligence (EAAI), 2024 Sunyuan Qiang Xianfei Li Yanyan Liang Wenlong Liao Tao He Pai Peng ObjD 173 0 0 14 May 2024
OpenDlign: Enhancing Open-World 3D Learning with Depth-Aligned Images Ye Mao Junpeng Jing K. Mikolajczyk VLM 111 0 0 25 Apr 2024
DVF: Advancing Robust and Accurate Fine-Grained Image Retrieval with Retrieval Guidelines Xin Jiang Hao Tang Rui Yan Jinhui Tang Zechao Li 194 13 0 24 Apr 2024
ChEX: Interactive Localization and Region Description in Chest X-rays Philip Muller Georgios Kaissis Daniel Rueckert 199 11 0 24 Apr 2024
Curriculum Point Prompting for Weakly-Supervised Referring Image Segmentation Qiyuan Dai Sibei Yang 169 24 0 18 Apr 2024
OSR-ViT: A Simple and Modular Framework for Open-Set Object Detection and Discovery Matthew J. Inkawhich Nathan Inkawhich Hao Yang Jingyang Zhang Randolph Linderman Yiran Chen ObjD 204 1 0 16 Apr 2024
DetCLIPv3: Towards Versatile Generative Open-vocabulary Object Detection Lewei Yao Renjie Pi Jianhua Han Xiaodan Liang Hang Xu Wei Zhang Zhenguo Li Dan Xu VLM ObjD 192 43 0 14 Apr 2024
Retrieval-Augmented Open-Vocabulary Object Detection Jooyeon Kim Eulrang Cho Sehyung Kim Hyunwoo J. Kim VLM ObjD 196 19 0 08 Apr 2024
3D-COCO: extension of MS-COCO dataset for image detection and 3D reconstruction modules Maxence Bideaux Alice Phe Mohamed Chaouch B. Luvison Q. C. Pham ISeg 3DV 172 2 0 08 Apr 2024
Hyperbolic Learning with Synthetic Captions for Open-World Detection Fanjie Kong Yanbei Chen Jiarui Cai Davide Modolo VLM ObjD 178 12 0 07 Apr 2024
ViTamin: Designing Scalable Vision Models in the Vision-Language EraComputer Vision and Pattern Recognition (CVPR), 2024 Jienneg Chen Qihang Yu Xiaohui Shen Yaoyao Liu Liang-Chieh Chen 3DV VLM 345 47 0 02 Apr 2024
Open-Vocabulary Object Detectors: Robustness Challenges under Distribution Shifts Prakash Chandra Chhipa Kanjar De Meenakshi Subhash Chippa Rajkumar Saini Marcus Liwicki ObjD VLM 213 4 0 01 Apr 2024
Open-Set Recognition in the Age of Vision-Language Models Dimity Miller Niko Sünderhauf Alex Kenna Keita Mason VLM 190 10 0 25 Mar 2024
T-Rex2: Towards Generic Object Detection via Text-Visual Prompt Synergy Qing Jiang Feng Li Zhaoyang Zeng Tianhe Ren Shilong Liu Lei Zhang VLM 255 78 0 21 Mar 2024
Find n' Propagate: Open-Vocabulary 3D Object Detection in Urban Environments Djamahl Etchegaray Zi Huang Tatsuya Harada Yadan Luo 217 12 0 20 Mar 2024
vid-TLDR: Training Free Token merging for Light-weight Video Transformer Joonmyung Choi Sanghyeok Lee Jaewon Chu Minhyuk Choi Hyunwoo J. Kim MoMe ViT 227 36 0 20 Mar 2024
As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks? Anjun Hu Jindong Gu Francesco Pinto Konstantinos Kamnitsas Juil Sock AAML SILM 174 8 0 19 Mar 2024
DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM YiXuan Wu Yizhou Wang Weizhen He Wenhao Wu Tong He Wanli Ouyang Jian Wu Juil Sock ObjD VLM 269 45 0 19 Mar 2024
Generative Region-Language Pretraining for Open-Ended Object DetectionComputer Vision and Pattern Recognition (CVPR), 2024 Chuang Lin Yi Jiang Zhuang Li Zehuan Yuan Jianfei Cai ObjD VLM 178 27 0 15 Mar 2024
Open-Vocabulary Object Detection with Meta Prompt Representation and Instance Contrastive OptimizationBritish Machine Vision Conference (BMVC), 2024 Zhao Wang Aoxue Li Fengwei Zhou Zhenguo Li Qi Dou ObjD VLM 180 4 0 14 Mar 2024
Exploring Robust Features for Few-Shot Object Detection in Satellite Imagery Xavier Bou Gabriele Facciolo R. G. V. Gioi Jean-Michel Morel T. Ehret ObjD 225 8 0 08 Mar 2024