v1v2 (latest)

CIDEr: Consensus-based Image Description Evaluation

Computer Vision and Pattern Recognition (CVPR), 2014

20 November 2014

Ramakrishna Vedantam

C. L. Zitnick

Devi Parikh

ArXiv (abs)PDF HTML

Papers citing "CIDEr: Consensus-based Image Description Evaluation"

50 / 2,353 papers shown

Look and Modify: Modification Networks for Image CaptioningBritish Machine Vision Conference (BMVC), 2019

Fawaz Sammani

Mahmoud Elsayed

123

07 Sep 2019

MoverScore: Text Generation Evaluating with Contextualized Embeddings and Earth Mover DistanceConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

484

665

05 Sep 2019

Stack-VS: Stacked Visual-Semantic Attention for Image Caption GenerationIEEE Access (IEEE Access), 2019

171

05 Sep 2019

REO-Relevance, Extraness, Omission: A Fine-grained Evaluation for Image CaptioningConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Lei Zhang

126

05 Sep 2019

Image Captioning with Very Scarce Supervised Data: Adversarial Semi-Supervised Learning ApproachConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

In So Kweon

229

05 Sep 2019

Decoupled Box Proposal and Featurization with Ultrafine-Grained Semantic Labels Improve Image Captioning and Visual Question AnsweringConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

240

04 Sep 2019

TIGEr: Text-to-Image Grounding for Image Caption EvaluationConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Lei Zhang

214

04 Sep 2019

Cosmos QA: Machine Reading Comprehension with Contextual Commonsense ReasoningConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Yejin Choi

316

497

31 Aug 2019

Reflective Decoding Network for Image CaptioningIEEE International Conference on Computer Vision (ICCV), 2019

182

105

30 Aug 2019

Aesthetic Image Captioning From Weakly-Labelled Photographs

Koustav Ghosal

A. Rana

A. Smolic

195

29 Aug 2019

Out the Window: A Crowd-Sourced Dataset for Activity Classification in Security Video

137

28 Aug 2019

Image Captioning with Sparse Recurrent Neural Network

161

28 Aug 2019

DeepCopy: Grounded Response Generation with Hierarchical Pointer NetworksSIGDIAL Conferences (SIGDIAL), 2019

154

28 Aug 2019

Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion NetworkIEEE International Conference on Computer Vision (ICCV), 2019

Wei Liu

227

177

27 Aug 2019

Towards Unsupervised Image Captioning with Shared Multimodal EmbeddingsIEEE International Conference on Computer Vision (ICCV), 2019

Iro Laina

Christian Rupprecht

Nassir Navab

SSL

182

112

25 Aug 2019

ViCo: Word Embeddings from Visual Co-occurrencesIEEE International Conference on Computer Vision (ICCV), 2019

Tanmay Gupta

Alex Schwing

Derek Hoiem

139

22 Aug 2019

Attention on Attention for Image CaptioningIEEE International Conference on Computer Vision (ICCV), 2019

319

965

19 Aug 2019

Abductive Commonsense ReasoningInternational Conference on Learning Representations (ICLR), 2019

Keisuke Sakaguchi

Hannah Rashkin

Yejin Choi

396

495

15 Aug 2019

Unpaired Cross-lingual Image Caption Generation with Self-Supervised RewardsACM Multimedia (ACM MM), 2019

Qin Jin

154

15 Aug 2019

Reactive Multi-Stage Feature Fusion for Multimodal Dialogue Modeling

192

14 Aug 2019

Towards Diverse and Accurate Image Captions via Reinforcing Determinantal Point Process

Qingzhong Wang

Antoni B. Chan

122

14 Aug 2019

Towards Generating Stylized Image Captions via Adversarial TrainingPacific Rim International Conference on Artificial Intelligence (PRICAI), 2019

Mark Dras

124

08 Aug 2019

Image Captioning using Facial Expression and AttentionJournal of Artificial Intelligence Research (JAIR), 2019

Mark Dras

206

08 Aug 2019

Scene-based Factored Attention for Image Captioning

147

07 Aug 2019

Addressing Data Bias Problems for Chest X-ray Image Report GenerationBritish Machine Vision Conference (BMVC), 2019

156

06 Aug 2019

Visual-Relation Conscious Image Generation from Structured-TextEuropean Conference on Computer Vision (ECCV), 2019

D. Vo

Akihiro Sugimoto

179

05 Aug 2019

Prediction and Description of Near-Future Activities in VideoComputer Vision and Image Understanding (CVIU), 2019

T. Mahmud

Mohammad Billah

Mahmudul Hasan

Amit K. Roy-Chowdhury

380

02 Aug 2019

Convolutional Auto-encoding of Sentence Topics for Image Paragraph GenerationInternational Joint Conference on Artificial Intelligence (IJCAI), 2019

Yingwei Pan

Tao Mei

163

01 Aug 2019

Curiosity-driven Reinforcement Learning for Diverse Visual Paragraph GenerationACM Multimedia (ACM MM), 2019

Zi Huang

105

01 Aug 2019

ShapeCaptioner: Generative Caption Network for 3D Shapes by Learning a Mapping from Parts Detected in Multiple Views to SentencesACM Multimedia (ACM MM), 2019

190

31 Jul 2019

Learning Question-Guided Video Representation for Multi-Turn Video Question Answering

31 Jul 2019

Cooperative image captioning

130

26 Jul 2019

Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and MethodsJournal of Artificial Intelligence Research (JAIR), 2019

413

142

22 Jul 2019

VIFIDEL: Evaluating the Visual Fidelity of Image DescriptionsAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Pranava Madhyastha

Josiah Wang

Lucia Specia

164

22 Jul 2019

Watch It Twice: Video Captioning with a Refocused Video EncoderACM Multimedia (ACM MM), 2019

Xiangxi Shi

Jianfei Cai

Shafiq Joty

Jiuxiang Gu

150

21 Jul 2019

Justifying Diagnosis Decisions by Deep Neural NetworksJournal of Biomedical Informatics (JBI), 2019

Graham Spinks

Marie-Francine Moens

137

12 Jul 2019

On the Evaluation of Conditional GANs

Terrance Devries

Adriana Romero

Luis Villaseñor-Pineda

Graham W. Taylor

M. Drozdzal

EGVM

186

11 Jul 2019

Informative Visual Storytelling with Cross-modal RulesACM Multimedia (ACM MM), 2019

182

07 Jul 2019

Multimodal Transformer Networks for End-to-End Video-Grounded Dialogue SystemsAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Hung Le

Doyen Sahoo

Nancy F. Chen

Guosheng Lin

177

120

02 Jul 2019

A Deep Decoder Structure Based on WordEmbedding Regression for An Encoder-Decoder Based Model for Image Captioning

A. Asadi

Reza Safabakhsh

26 Jun 2019

Informative Image Captioning with External Sources of InformationAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

125

20 Jun 2019

Automatic Source Code Summarization with Extended Tree-LSTMIEEE International Joint Conference on Neural Network (IJCNN), 2019

270

19 Jun 2019

Expressing Visual Relationships via LanguageAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

235

18 Jun 2019

Generating Diverse and Informative Natural Language Fashion Feedback

123

15 Jun 2019

Comparison of Diverse Decoding Methods from Conditional Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

João Sedoc

161

130

14 Jun 2019

Improving Visual Question Answering by Referring to Generated Paragraph CaptionsAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Hyounghun Kim

Joey Tianyi Zhou

CoGe

109

14 Jun 2019

Image Captioning: Transforming Objects into WordsNeural Information Processing Systems (NeurIPS), 2019

441

546

14 Jun 2019

Continual and Multi-Task Architecture SearchAnnual Meeting of the Association for Computational Linguistics (ACL), 2019

Ramakanth Pasunuru

Joey Tianyi Zhou

CLL

179

12 Jun 2019

Object-aware Aggregation with Bidirectional Temporal Graph for Video CaptioningComputer Vision and Pattern Recognition (CVPR), 2019

Junchao Zhang

Yuxin Peng

180

188

11 Jun 2019

Generation of Multimodal Justification Using Visual Word Constraint Model for Explainable Computer-Aided Diagnosis

142

10 Jun 2019