SPICE: Semantic Propositional Image Caption Evaluation

29 July 2016

Papers citing "SPICE: Semantic Propositional Image Caption Evaluation"

50 / 1,005 papers shown

A-CAP: Anticipation Captioning with Commonsense KnowledgeComputer Vision and Pattern Recognition (CVPR), 2023

168

13 Apr 2023

Model-Agnostic Gender Debiased Image CaptioningComputer Vision and Pattern Recognition (CVPR), 2023

349

07 Apr 2023

Graph Attention for Automated Audio CaptioningIEEE Signal Processing Letters (IEEE SPL), 2023

220

07 Apr 2023

Cross-Domain Image Captioning with Discriminative FinetuningComputer Vision and Pattern Recognition (CVPR), 2023

Roberto Dessì

Michele Bevilacqua

Eleonora Gualdoni

Nathanaël Carraz Rakotonirina

Francesca Franzon

Marco Baroni

CLIP

254

04 Apr 2023

Prefix tuning for automated audio captioningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Minkyu Kim

Kim Sung-Bin

Tae-Hyun Oh

375

30 Mar 2023

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal ResearchIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

358

336

30 Mar 2023

AutoAD: Movie Description in ContextComputer Vision and Pattern Recognition (CVPR), 2023

280

29 Mar 2023

Hierarchical Video-Moment Retrieval and Step-CaptioningComputer Vision and Pattern Recognition (CVPR), 2023

298

29 Mar 2023

Positive-Augmented Contrastive Learning for Image and Video Captioning EvaluationComputer Vision and Pattern Recognition (CVPR), 2023

Lorenzo Baraldi

348

21 Mar 2023

TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question AnsweringIEEE International Conference on Computer Vision (ICCV), 2023

Mari Ostendorf

386

364

21 Mar 2023

GNNFormer: A Graph-based Framework for Cytopathology Report Generation

188

17 Mar 2023

Lana: A Language-Capable Navigator for Instruction Following and GenerationComputer Vision and Pattern Recognition (CVPR), 2023

250

15 Mar 2023

PR-MCS: Perturbation Robust Metric for MultiLingual Image CaptioningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

317

15 Mar 2023

FactReranker: Fact-guided Reranker for Faithful Radiology Report Summarization

Fei Wang

257

15 Mar 2023

ZeroNLG: Aligning and Autoencoding Domains for Zero-Shot Multimodal and Multilingual Natural Language GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2023

Yaowei Wang

308

11 Mar 2023

Learning Combinatorial Prompts for Universal Controllable Image CaptioningInternational Journal of Computer Vision (IJCV), 2023

Zhen Wang

Jun Xiao

Yueting Zhuang

Fei Gao

Jian Shao

Long Chen

209

11 Mar 2023

Refined Vision-Language Modeling for Fine-grained Multi-modal Pre-training

204

09 Mar 2023

Interpretable Visual Question Answering Referring to Outside KnowledgeInternational Conference on Information Photonics (ICIP), 2023

He Zhu

Ren Togo

Takahiro Ogawa

Miki Haseyama

168

08 Mar 2023

Graph Neural Networks in Vision-Language Image Understanding: A SurveyThe Visual Computer (TVC), 2023

325

07 Mar 2023

Neighborhood Contrastive Transformer for Change CaptioningIEEE transactions on multimedia (IEEE TMM), 2023

Yunbin Tu

195

06 Mar 2023

DeCap: Decoding CLIP Latents for Zero-Shot Captioning via Text-Only TrainingInternational Conference on Learning Representations (ICLR), 2023

Yi Yang

230

124

06 Mar 2023

Comparative study of Transformer and LSTM Network with attention mechanism on Image Captioning

183

05 Mar 2023

ConZIC: Controllable Zero-shot Image Captioning by Sampling-Based PolishingComputer Vision and Pattern Recognition (CVPR), 2023

Dongsheng Wang

244

04 Mar 2023

Language Is Not All You Need: Aligning Perception with Language ModelsNeural Information Processing Systems (NeurIPS), 2023

...

Xia Song

356

699

27 Feb 2023

Learning Visual Representations via Language-Guided SamplingComputer Vision and Pattern Recognition (CVPR), 2023

464

23 Feb 2023

Test-Time Distribution Normalization for Contrastively Learned Vision-language ModelsNeural Information Processing Systems (NeurIPS), 2023

Ser-Nam Lim

265

22 Feb 2023

Retrieval-augmented Image CaptioningConference of the European Chapter of the Association for Computational Linguistics (EACL), 2023

199

16 Feb 2023

Towards Local Visual Modeling for Image CaptioningPattern Recognition (Pattern Recogn.), 2023

Jiayi Ji

262

110

13 Feb 2023

Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning

Mozhgan Pourkeshavarz

Shahabedin Nabavi

Mohsen Moghaddam

M. Shamsfard

197

08 Feb 2023

KENGIC: KEyword-driven and N-Gram Graph based Image CaptioningInternational Conference on Digital Image Computing: Techniques and Applications (DICTA), 2022

Brandon Birmingham

A. Muscat

118

07 Feb 2023

DEVICE: Depth and Visual Concepts Aware Transformer for OCR-based Image CaptioningPattern Recognition (Pattern Recogn.), 2023

563

03 Feb 2023

Style-Aware Contrastive Learning for Multi-Style Image CaptioningFindings (Findings), 2023

Yucheng Zhou

Guodong Long

164

26 Jan 2023

Semi-Supervised Image Captioning by Adversarially Propagating Labeled DataIEEE Access (IEEE Access), 2023

In So Kweon

162

26 Jan 2023

Towards a Unified Model for Generating Answers and Explanations in Visual Question AnsweringFindings (Findings), 2023

Chenxi Whitehouse

Tillman Weyde

Pranava Madhyastha

LRM

292

25 Jan 2023

Visual Semantic Relatedness Dataset for Image Captioning

Ahmed Sabir

Francesc Moreno-Noguer

Lluís Padró

CoGe VLM

221

20 Jan 2023

Embodied Agents for Efficient Exploration and Smart Scene DescriptionIEEE International Conference on Robotics and Automation (ICRA), 2023

Lorenzo Baraldi

185

17 Jan 2023

Advances in Medical Image Analysis with Vision Transformers: A Comprehensive Review

Reza Azad

Amirhossein Kazerouni

Moein Heidari

Ehsan Khodapanah Aghdam

401

331

09 Jan 2023

Adaptively Clustering Neighbor Elements for Image-Text Generation

556

05 Jan 2023

Do DALL-E and Flamingo Understand Each Other?IEEE International Conference on Computer Vision (ICCV), 2022

Jindong Gu

231

23 Dec 2022

Benchmarking Spatial Relationships in Text-to-Image Generation

Yezhou Yang

389

20 Dec 2022

MetaCLUE: Towards Comprehensive Visual Metaphors ResearchComputer Vision and Pattern Recognition (CVPR), 2022

...

Yuanzhen Li

207

19 Dec 2022

Efficient Image Captioning for Edge DevicesAAAI Conference on Artificial Intelligence (AAAI), 2022

Linlin Li

224

18 Dec 2022

Harnessing the Power of Multi-Task Pretraining for Ground-Truth Level Natural Language Explanations

226

08 Dec 2022

Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement LearningIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Ukyo Honda

Taro Watanabe

Yuji Matsumoto

242

06 Dec 2022

Semantic-Conditional Diffusion Networks for Image CaptioningComputer Vision and Pattern Recognition (CVPR), 2022

Yingwei Pan

Tao Mei

248

116

06 Dec 2022

Towards Generating Diverse Audio Captions via Adversarial TrainingIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

308

05 Dec 2022

Controllable Image Captioning via PromptingAAAI Conference on Artificial Intelligence (AAAI), 2022

Linlin Li

264

04 Dec 2022

Uncertainty-Aware Image CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2022

Zhengcong Fei

Junshi Huang

232

30 Nov 2022

CLID: Controlled-Length Image Descriptions with Limited DataIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

Elad Hirsch

A. Tal

VLM 3DV

293

27 Nov 2022

Aesthetically Relevant Image CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2022

Zhipeng Zhong

Fei Zhou

Guoping Qiu

134

25 Nov 2022