Dynamic Graph Attention for Referring Expression Comprehension

IEEE International Conference on Computer Vision (ICCV), 2019

18 September 2019

Papers citing "Dynamic Graph Attention for Referring Expression Comprehension"

50 / 120 papers shown

Advancing Visual Grounding with Scene Knowledge: Benchmark and MethodComputer Vision and Pattern Recognition (CVPR), 2023

Xiang Wan

169

21 Jul 2023

TreePrompt: Learning to Compose Tree Prompts for Explainable Visual Grounding

Lei Chen

171

19 May 2023

What does CLIP know about a red circle? Visual prompt engineering for VLMsIEEE International Conference on Computer Vision (ICCV), 2023

Aleksandar Shtedritski

Christian Rupprecht

Andrea Vedaldi

VLM MLLM

373

228

13 Apr 2023

WildRefer: 3D Object Localization in Large-scale Dynamic Scenes with Multi-modal Visual Data and Natural LanguageEuropean Conference on Computer Vision (ECCV), 2023

Xinge Zhu

Yuexin Ma

286

12 Apr 2023

Parallel Vertex Diffusion for Unified Visual GroundingAAAI Conference on Artificial Intelligence (AAAI), 2023

255

13 Mar 2023

Universal Instance Perception as Object Discovery and RetrievalComputer Vision and Pattern Recognition (CVPR), 2023

Ping Luo

Huchuan Lu

372

234

12 Mar 2023

Open-vocabulary Object Segmentation with Diffusion ModelsIEEE International Conference on Computer Vision (ICCV), 2023

316

12 Jan 2023

YORO -- Lightweight End to End Visual Grounding

172

15 Nov 2022

RSVG: Exploring Data and Models for Visual Grounding on Remote Sensing DataIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2022

Yangfan Zhan

Zhitong Xiong

Yuan. Yuan

241

179

23 Oct 2022

Vision+X: A Survey on Multimodal Learning in the Light of DataIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Ye Zhu

Yuehua Wu

Andrii Zadaianchuk

Yan Yan

354

05 Oct 2022

Enhancing Interpretability and Interactivity in Robot Manipulation: A Neurosymbolic Approach

Georgios Tziafas

Hamidreza Kasaei

LM&Ro

347

03 Oct 2022

Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual GroundingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

226

28 Sep 2022

A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented PerspectiveIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Chaoqi Chen

379

130

27 Sep 2022

Ground then Navigate: Language-guided Navigation in Dynamic ScenesIEEE International Conference on Robotics and Automation (ICRA), 2022

196

24 Sep 2022

PPMN: Pixel-Phrase Matching Network for One-Stage Panoptic Narrative GroundingACM Multimedia (ACM MM), 2022

Junshi Huang

194

11 Aug 2022

One for All: One-stage Referring Expression Comprehension with Dynamic ReasoningNeurocomputing (Neurocomputing), 2022

291

31 Jul 2022

SiRi: A Simple Selective Retraining Mechanism for Transformer-based Visual GroundingEuropean Conference on Computer Vision (ECCV), 2022

Xiaodan Liang

121

27 Jul 2022

Correspondence Matters for Video Referring Expression ComprehensionACM Multimedia (ACM MM), 2022

301

21 Jul 2022

Gaussian Kernel-based Cross Modal Network for Spatio-Temporal Video GroundingInternational Conference on Information Photonics (ICIP), 2022

Zeyu Xiong

Daizong Liu

Technology

02 Jul 2022

Bear the Query in Mind: Visual Grounding with Query-conditioned Convolution

Xiang Li

Bhiksha Raj

ObjD

276

18 Jun 2022

RefCrowd: Grounding the Target in Crowd with Referring ExpressionsACM Multimedia (ACM MM), 2022

Qingbo Wu

Fanman Meng

ObjD

205

16 Jun 2022

TransVG++: End-to-End Visual Grounding with Language Conditioned Vision TransformerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Wanli Ouyang

240

14 Jun 2022

Sim-To-Real Transfer of Visual Grounding for Human-Aided Ambiguity Resolution

Georgios Tziafas

S. Kasaei

253

24 May 2022

Improving Visual Grounding with Visual-Linguistic Verification and Iterative ReasoningComputer Vision and Pattern Recognition (CVPR), 2022

Li Yang

Yan Xu

Chunfen Yuan

Wei Liu

Bing Li

Weiming Hu

ObjD

289

155

30 Apr 2022

Instance-Specific Feature Propagation for Referring SegmentationIEEE transactions on multimedia (IEEE TMM), 2022

158

26 Apr 2022

3D-SPS: Single-Stage 3D Visual Grounding via Referred Point Progressive SelectionComputer Vision and Pattern Recognition (CVPR), 2022

249

125

13 Apr 2022

Position-aware Location Regression Network for Temporal Video GroundingAdvanced Video and Signal Based Surveillance (AVSS), 2021

Sunoh Kim

Kimin Yun

J. Choi

140

12 Apr 2022

Adapting CLIP For Phrase Localization Without Further Training

205

07 Apr 2022

FindIt: Generalized Localization with Natural Language QueriesEuropean Conference on Computer Vision (ECCV), 2022

202

31 Mar 2022

TubeDETR: Spatio-Temporal Video Grounding with TransformersComputer Vision and Pattern Recognition (CVPR), 2022

340

121

30 Mar 2022

Shifting More Attention to Visual Backbone: Query-modulated Refinement Networks for End-to-End Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2022

Jiabo Ye

Ji Zhang

227

29 Mar 2022

Differentiated Relevances Embedding for Group-based Referring Expression Comprehension

Yue Gao

183

12 Mar 2022

Suspected Object Matters: Rethinking Model's Prediction for One-stage Visual GroundingACM Multimedia (ACM MM), 2022

219

10 Mar 2022

Temporal Sentence Grounding in Videos: A Survey and Future DirectionsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

370

20 Jan 2022

Unpaired Referring Expression Grounding via Bidirectional Cross-Modal MatchingNeurocomputing (Neurocomputing), 2022

Hengcan Shi

Munawar Hayat

Jianfei Cai

ObjD

201

18 Jan 2022

Deconfounded Visual GroundingAAAI Conference on Artificial Intelligence (AAAI), 2021

Hanwang Zhang

191

31 Dec 2021

HR-RCNN: Hierarchical Relational Reasoning for Object Detection

Hao Chen

Abhinav Shrivastava

202

26 Oct 2021

Calibrating Concepts and Operations: Towards Symbolic Reasoning on Real Images

Elias Stengel-Eskin

Cihang Xie

153

01 Oct 2021

Word2Pix: Word to Pixel Cross Attention Transformer in Visual GroundingIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

186

31 Jul 2021

LanguageRefer: Spatial-Language Model for 3D Visual GroundingConference on Robot Learning (CoRL), 2021

298

111

07 Jul 2021

Cross-Modal Progressive Comprehension for Referring SegmentationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

240

162

15 May 2021

VL-NMS: Breaking Proposal Bottlenecks in Two-Stage Visual-Language Matching

Hanwang Zhang

273

12 May 2021

Proposal-free One-stage Referring Expression via Grid-Word Cross-AttentionInternational Joint Conference on Artificial Intelligence (IJCAI), 2021

Wei Suo

Mengyang Sun

Peng Wang

Qi Wu

ObjD

174

05 May 2021

Understanding Synonymous Referring Expressions via Contrastive FeaturesInternational Journal of Computer Vision (IJCV), 2021

Yi-Wen Chen

Yi-Hsuan Tsai

Ming-Hsuan Yang

ObjD

175

20 Apr 2021

TransVG: End-to-End Visual Grounding with TransformersIEEE International Conference on Computer Vision (ICCV), 2021

603

442

17 Apr 2021

Look Before You Leap: Learning Landmark Features for One-Stage Visual GroundingComputer Vision and Pattern Recognition (CVPR), 2021

318

123

09 Apr 2021

Co-Grounding Networks with Semantic Attention for Referring Expression Comprehension in VideosComputer Vision and Pattern Recognition (CVPR), 2021

144

23 Mar 2021

Decoupled Spatial Temporal Graphs for Generic Visual Grounding

Qi Feng

Yunchao Wei

Mingming Cheng

Yi Yang

139

18 Mar 2021

Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD ImagesComputer Vision and Pattern Recognition (CVPR), 2021

272

14 Mar 2021

OCID-Ref: A 3D Robotic Dataset with Embodied Language for Clutter Scene GroundingNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

Hung-Ting Su

172

13 Mar 2021