DenseCap: Fully Convolutional Localization Networks for Dense Captioning

24 November 2015

Li Fei-Fei

Papers citing "DenseCap: Fully Convolutional Localization Networks for Dense Captioning"

50 / 468 papers shown

Bypass Network for Semantics Driven Image Paragraph CaptioningComputer Vision and Image Understanding (CVIU), 2022

Qinjie Zheng

Chaoyue Wang

Dadong Wang

219

21 Jun 2022

FD-CAM: Improving Faithfulness and Discriminability of Visual Explanation for CNNsInternational Conference on Pattern Recognition (ICPR), 2022

131

17 Jun 2022

Language Models Can See: Plugging Visual Controls in Text Generation

Lingpeng Kong

270

111

05 May 2022

Diverse Image Captioning with Grounded StyleGerman Conference on Pattern Recognition (GCPR), 2022

Franz Klein

Shweta Mahajan

S. Roth

211

03 May 2022

CapOnImage: Context-driven Dense-Captioning on ImageConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

189

27 Apr 2022

"It Feels Like Being Locked in A Cage": Understanding Blind or Low Vision Streamers' Perceptions of Content Curation Algorithms

24 Apr 2022

Spatiality-guided Transformer for 3D Dense Captioning on Point CloudsInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Heng Wang

Chaoyi Zhang

Jianhui Yu

Weidong (Tom) Cai

3DPC

214

22 Apr 2022

Vision Transformers in Medical Computer Vision -- A Contemplative Retrospection

Arshi Parvaiz

Muhammad Anwaar Khalid

228

29 Mar 2022

ViNTER: Image Narrative Generation with Emotion-Arc-Aware TransformerThe Web Conference (WWW), 2022

301

15 Feb 2022

Describing image focused in cognitive and visual details for visually impaired people: An approach to generating inclusive paragraphsVISIGRAPP (VISIGRAPP), 2022

Daniel Louzada Fernandes

Marcos Henrique Fonseca Ribeiro

F. Cerqueira

Michel Melo Silva

116

10 Feb 2022

The Abduction of Sherlock Holmes: A Dataset for Visual Abductive ReasoningEuropean Conference on Computer Vision (ECCV), 2022

Yejin Choi

494

10 Feb 2022

Robotic Grasping from Classical to Modern: A Survey

227

08 Feb 2022

Deep Learning Approaches on Image Captioning: A ReviewACM Computing Surveys (ACM CSUR), 2022

480

150

31 Jan 2022

Synchronized Audio-Visual Frames with Fractional Positional Encoding for Transformers in Video-to-Text TranslationInternational Conference on Information Photonics (ICIP), 2021

153

28 Dec 2021

Bottom Up Top Down Detection Transformers for Language Grounding in Images and Point Clouds

478

147

16 Dec 2021

MAGIC: Multimodal relAtional Graph adversarIal inferenCe for Diverse and Unpaired Text-based Image Captioning

266

13 Dec 2021

Magnifying Networks for Images with Billions of Pixels

Neofytos Dimitriou

Ognjen Arandjelovic

347

12 Dec 2021

D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding

Dave Zhenyu Chen

Qirui Wu

Matthias Nießner

Angel X. Chang

196

02 Dec 2021

Object-Centric Unsupervised Image Captioning

Ser-Nam Lim

194

02 Dec 2021

ContIG: Self-supervised Multimodal Contrastive Learning for Medical Imaging with GeneticsComputer Vision and Pattern Recognition (CVPR), 2021

529

26 Nov 2021

Talk-to-Resolve: Combining scene understanding and spatial dialogue to resolve granular task ambiguity for a collocated robot

213

22 Nov 2021

ClevrTex: A Texture-Rich Benchmark for Unsupervised Multi-Object Segmentation

Laurynas Karazija

Iro Laina

Christian Rupprecht

3DV VOS

311

103

19 Nov 2021

Single-Modal Entropy based Active Learning for Visual Question AnsweringBritish Machine Vision Conference (BMVC), 2021

In So Kweon

194

21 Oct 2021

Integrating Visuospatial, Linguistic and Commonsense Structure into Story VisualizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

A. Maharana

Joey Tianyi Zhou

252

21 Oct 2021

A Self-Explainable Stylish Image Captioning Framework via Multi-References

Chengxi Li

Brent Harrison

191

20 Oct 2021

AUTO-DISCERN: Autonomous Driving Using Common Sense Reasoning

124

17 Oct 2021

Topic Scene Graph Generation by Attention Distillation from CaptionIEEE International Conference on Computer Vision (ICCV), 2021

Wenbin Wang

R. Wang

X. Chen

DiffM

213

12 Oct 2021

Geometry-Entangled Visual Semantic Transformer for Image Captioning

158

29 Sep 2021

CIDEr-R: Robust Consensus-based Image Description Evaluation

G. O. D. Santos

Esther Luna Colombini

Sandra Avila

151

28 Sep 2021

Survey: Transformer based Video-Language Pre-training

Ludan Ruan

Qin Jin

VLM ViT

205

21 Sep 2021

Image Captioning for Effective Use of Language Models in Knowledge-Based Visual Question Answering

Ander Salaberria

Gorka Azkune

Oier López de Lacalle

Aitor Soroa Etxabe

Eneko Agirre

298

15 Sep 2021

RefineCap: Concept-Aware Refinement for Image Captioning

119

08 Sep 2021

Journalistic Guidelines Aware News Image CaptioningConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

242

07 Sep 2021

Improving Object Detection and Attribute Recognition by Feature Entanglement ReductionInternational Conference on Information Photonics (ICIP), 2021

Zhao-Heng Zheng

Arka Sadhu

Ramkant Nevatia

25 Aug 2021

INVIGORATE: Interactive Visual Grounding and Grasping in Clutter

Yunfan Lu

222

25 Aug 2021

Caption Generation on Scenes with Seen and Unseen Object CategoriesImage and Vision Computing (IVC), 2021

B. Demirel

R. G. Cinbis

VLM

274

13 Aug 2021

Neural Twins Talk & Alternative CalculationsInternational Journal of Semantic Computing (IJSC), 2021

Zanyar Zohourianshahzadi

Jugal Kalita

136

05 Aug 2021

Dual Graph Convolutional Networks with Transformer and Curriculum Learning for Image CaptioningACM Multimedia (ACM MM), 2021

273

05 Aug 2021

ReFormer: The Relational Transformer for Image CaptioningACM Multimedia (ACM MM), 2021

213

29 Jul 2021

From Show to Tell: A Survey on Deep Learning-based Image CaptioningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Lorenzo Baraldi

435

344

14 Jul 2021

Leveraging Explainability for Comprehending Referring Expressions in the Real World

Fethiye Irmak Dogan

G. I. Melsión

Iolanda Leite

194

12 Jul 2021

Controlled Caption Generation for Images Through Adversarial Attacks

Wei Liu

132

07 Jul 2021

Morphological Classification of Galaxies in S-PLUS using an Ensemble of Convolutional Networks

C. Mendes de Oliveira

05 Jul 2021

Pre-Trained Models: Past, Present and FutureAI Open (AO), 2021

Xu Han

Zhengyan Zhang

Ning Ding

Yuxian Gu

Xiao Liu

...

Jun Zhu

384

985

14 Jun 2021

Check It Again: Progressive Visual Question Answering via Visual EntailmentAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Zheng Lin

151

08 Jun 2021

Giving Commands to a Self-Driving Car: How to Deal with Uncertain Situations?Engineering applications of artificial intelligence (EAAI), 2021

Thierry Deruyttere

Victor Milewski

Marie-Francine Moens

196

08 Jun 2021

An End-to-End Breast Tumour Classification Model Using Context-Based Patch Modelling- A BiLSTM Approach for Image Classification

S. Tripathi

S. Singh

H. Lee

124

05 Jun 2021

Connecting What to Say With Where to Look by Modeling Human Attention TracesComputer Vision and Pattern Recognition (CVPR), 2021

Babak Damavandi

261

12 May 2021

Analyzing Online Political AdvertisementsFindings (Findings), 2021

Danae Sánchez Villegas

S. Mokaram

Nikolaos Aletras

225

09 May 2021

Towards Accurate Text-based Image Captioning with Content Diversity ExplorationComputer Vision and Pattern Recognition (CVPR), 2021

Qi Wu

233

23 Apr 2021