Rethinking Diversified and Discriminative Proposal Generation for Visual Grounding

9 May 2018

Zhou Zhao

Papers citing "Rethinking Diversified and Discriminative Proposal Generation for Visual Grounding"

21 / 71 papers shown

PhraseCut: Language-based Image Segmentation in the Wild

241

136

03 Aug 2020

Referring Expression Comprehension: A Survey of Methods and DatasetsIEEE transactions on multimedia (TMM), 2020

Yanyuan Qiao

Chaorui Deng

Qi Wu

ObjD

341

118

19 Jul 2020

Self-Segregating and Coordinated-Segregating Transformer for Focused Deep Multi-Modular Network for Visual Question Answering

C. Sur

25 Jun 2020

Deep Multimodal Neural Architecture SearchACM Multimedia (ACM MM), 2020

Meng Wang

165

108

25 Apr 2020

Image Co-skeletonization via Co-segmentationIEEE Transactions on Image Processing (TIP), 2020

Koteswar Rao Jerripothula

Jianfei Cai

Jiangbo Lu

Junsong Yuan

12 Apr 2020

Multi-task Collaborative Network for Joint Referring Expression Comprehension and SegmentationComputer Vision and Pattern Recognition (CVPR), 2020

Liujuan Cao

469

349

19 Mar 2020

MUTATT: Visual-Textual Mutual Guidance for Referring Expression ComprehensionIEEE International Conference on Multimedia and Expo (ICME), 2020

156

18 Mar 2020

A Real-time Global Inference Network for One-stage Referring Expression ComprehensionIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2019

Xinghao Ding

192

07 Dec 2019

Learning Cross-modal Context Graph for Visual GroundingAAAI Conference on Artificial Intelligence (AAAI), 2019

269

20 Nov 2019

Phrase Grounding by Soft-Label Chain Conditional Random FieldConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Hamish Ivison

Anjali Narayan-Chen

111

01 Sep 2019

Zero-Shot Grounding of Objects from Natural Language QueriesIEEE International Conference on Computer Vision (ICCV), 2019

250

172

20 Aug 2019

Multimodal Unified Attention Networks for Vision-and-Language Interactions

252

12 Aug 2019

Bilinear Graph Networks for Visual Question AnsweringIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2019

199

23 Jul 2019

Deep Modular Co-Attention Networks for Visual Question AnsweringComputer Vision and Pattern Recognition (CVPR), 2019

323

929

25 Jun 2019

Joint Visual Grounding with Language Scene Graphs

Meng Wang

191

09 Jun 2019

ActivityNet-QA: A Dataset for Understanding Complex Web Videos via Question AnsweringAAAI Conference on Artificial Intelligence (AAAI), 2019

Zhou Zhao

307

612

06 Jun 2019

Learning to Compose and Reason with Language Tree Structures for Visual GroundingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

235

197

05 Jun 2019

Multimodal Transformer with Multi-View Visual Representation for Image Captioning

193

426

20 May 2019

Image-Question-Answer Synergistic Network for Visual DialogComputer Vision and Pattern Recognition (CVPR), 2019

Dalu Guo

Chang Xu

Dacheng Tao

168

26 Feb 2019

AU R-CNN: Encoding Expert Prior Knowledge into R-CNN for Action Unit Detection

Chen Ma

Li Chen

Jun-hai Yong

129

14 Dec 2018

Learning to Assemble Neural Module Tree Networks for Visual Grounding

377

306

08 Dec 2018