v1v2v3 (latest)

Ref-NMS: Breaking Proposal Bottlenecks in Two-Stage Referring Expression Grounding

AAAI Conference on Artificial Intelligence (AAAI), 2020

3 September 2020

ArXiv (abs)PDF HTML Github (22★)

Papers citing "Ref-NMS: Breaking Proposal Bottlenecks in Two-Stage Referring Expression Grounding"

44 / 44 papers shown

UniSOT: A Unified Framework for Multi-Modality Single Object TrackingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

221

03 Nov 2025

Improving Generalized Visual Grounding with Instance-aware Joint LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2025

255

17 Sep 2025

Prototype-Aware Multimodal Alignment for Open-Vocabulary Visual Grounding

170

08 Sep 2025

PropVG: End-to-End Proposal-Driven Visual Grounding with Multi-Granularity Discrimination

229

05 Sep 2025

To Predict or Not To Predict? Proportionally Masked Autoencoders for Tabular Data Imputation

Jungkyu Kim

Kibok Lee

Taeyoung Park

349

26 Dec 2024

Phrase Decoupling Cross-Modal Hierarchical Matching and Progressive Position Correction for Visual GroundingIEEE transactions on multimedia (IEEE TMM), 2024

Huafeng Li

183

31 Oct 2024

Make Graph-based Referring Expression Comprehension Great Again through Expression-guided Dynamic Gating and RegressionIEEE transactions on multimedia (IEEE TMM), 2024

Yen-Yu Lin

258

05 Sep 2024

ResVG: Enhancing Relation and Semantic Understanding in Multiple Instances for Visual GroundingACM Multimedia (MM), 2024

Minghang Zheng

Jiahua Zhang

Qingchao Chen

Yuxin Peng

Yang Liu

ObjD

297

29 Aug 2024

R2G: Reasoning to Ground in 3D ScenesPattern Recognition (Pattern Recogn.), 2024

Yixuan Li

Zan Wang

Wei Liang

309

24 Aug 2024

An Efficient and Effective Transformer Decoder-Based Framework for Multi-Task Visual GroundingEuropean Conference on Computer Vision (ECCV), 2024

Wei Chen

Mahdieh Hatamian

Yu Wu

238

02 Aug 2024

SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning

Xu Jia

240

10 Jul 2024

ACTRESS: Active Retraining for Semi-supervised Visual Grounding

Weitai Kang

Mengxue Qu

Yunchao Wei

Yan Yan

326

03 Jul 2024

Visual Grounding with Attention-Driven Constraint Balancing

Weitai Kang

287

03 Jul 2024

SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding

Weitai Kang

Gaowen Liu

Mubarak Shah

Yan Yan

ObjD

409

03 Jul 2024

ScanFormer: Referring Expression Comprehension by Iteratively Scanning

278

26 Jun 2024

How to Understand "Support"? An Implicit-enhanced Causal Inference Approach for Weakly-supervised Phrase Grounding

234

29 Feb 2024

Unifying Visual and Vision-Language Tracking via Contrastive LearningAAAI Conference on Artificial Intelligence (AAAI), 2024

221

20 Jan 2024

Bridging Modality Gap for Visual Grounding with Effecitve Cross-modal DistillationChinese Conference on Pattern Recognition and Computer Vision (CPRCV), 2023

280

29 Dec 2023

Context Disentangling and Prototype Inheriting for Robust Visual Grounding

Wei Tang

271

19 Dec 2023

Whether you can locate or not? Interactive Referring Expression GenerationACM Multimedia (ACM MM), 2023

208

19 Aug 2023

Language-Guided Diffusion Model for Visual Grounding

Sijia Chen

Baochun Li

638

18 Aug 2023

Iterative Robust Visual Grounding with Masked Reference based Centerpoint Supervision

Xiangtai Li

275

23 Jul 2023

Towards Open Vocabulary Learning: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Xiangtai Li

...

Jiangning Zhang

406

218

28 Jun 2023

Language Adaptive Weight Generation for Multi-task Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2023

Xi Li

292

06 Jun 2023

Referring Expression Comprehension Using Language Adaptive InferenceAAAI Conference on Artificial Intelligence (AAAI), 2023

Xi Li

252

06 Jun 2023

TreePrompt: Learning to Compose Tree Prompts for Explainable Visual Grounding

Lei Chen

171

19 May 2023

Cross-Modality Time-Variant Relation Learning for Generating Dynamic Scene GraphsIEEE International Conference on Robotics and Automation (ICRA), 2023

Jingyi Wang

Jinfa Huang

Can Zhang

Zhidong Deng

339

15 May 2023

Champion Solution for the WSDM2023 Toloka VQA Challenge

198

22 Jan 2023

Integrating Object-aware and Interaction-aware Knowledge for Weakly Supervised Scene Graph GenerationACM Multimedia (ACM MM), 2022

Yi Yang

196

03 Aug 2022

Correspondence Matters for Video Referring Expression ComprehensionACM Multimedia (ACM MM), 2022

305

21 Jul 2022

Rethinking Data Augmentation for Robust Visual Question AnsweringEuropean Conference on Computer Vision (ECCV), 2022

197

18 Jul 2022

TransVG++: End-to-End Visual Grounding with Language Conditioned Vision TransformerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Wanli Ouyang

240

14 Jun 2022

Improving Visual Grounding with Visual-Linguistic Verification and Iterative ReasoningComputer Vision and Pattern Recognition (CVPR), 2022

Li Yang

Yan Xu

Chunfen Yuan

Wei Liu

Bing Li

Weiming Hu

ObjD

292

155

30 Apr 2022

Self-paced Multi-grained Cross-modal Interaction Modeling for Referring Expression ComprehensionIEEE Transactions on Image Processing (IEEE TIP), 2022

Xi Li

333

21 Apr 2022

Shifting More Attention to Visual Backbone: Query-modulated Refinement Networks for End-to-End Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2022

Jiabo Ye

Ji Zhang

230

29 Mar 2022

Differentiated Relevances Embedding for Group-based Referring Expression Comprehension

Yue Gao

183

12 Mar 2022

Suspected Object Matters: Rethinking Model's Prediction for One-stage Visual GroundingACM Multimedia (ACM MM), 2022

227

10 Mar 2022

Deconfounded Visual GroundingAAAI Conference on Artificial Intelligence (AAAI), 2021

Hanwang Zhang

199

31 Dec 2021

Rethinking the Two-Stage Framework for Grounded Situation Recognition

Wei Ji

194

10 Dec 2021

Classification-Then-Grounding: Reformulating Video Scene Graphs as Temporal Bipartite Graphs

223

08 Dec 2021

Word2Pix: Word to Pixel Cross Attention Transformer in Visual GroundingIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

194

31 Jul 2021

VL-NMS: Breaking Proposal Bottlenecks in Two-Stage Visual-Language Matching

Hanwang Zhang

273

12 May 2021

Understanding Synonymous Referring Expressions via Contrastive FeaturesInternational Journal of Computer Vision (IJCV), 2021

Yi-Wen Chen

Yi-Hsuan Tsai

Ming-Hsuan Yang

ObjD

182

20 Apr 2021

Boundary Proposal Network for Two-Stage Natural Language Video LocalizationAAAI Conference on Artificial Intelligence (AAAI), 2021

Wei Ji

199

178

15 Mar 2021