SPICE: Semantic Propositional Image Caption Evaluation

29 July 2016

Papers citing "SPICE: Semantic Propositional Image Caption Evaluation"

50 / 1,002 papers shown

Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2

115

09 Aug 2022

Distinctive Image Captioning via CLIP Guided Group Optimization

Wenjia Xu

376

08 Aug 2022

Prompt Tuning for Generative Multimodal Pretrained Models

Han Yang

Junyang Lin

An Yang

Peng Wang

Chang Zhou

Hongxia Yang

VLM LRM VPVLM

183

04 Aug 2022

Retrieval-Augmented Transformer for Image CaptioningInternational Conference on Content-Based Multimedia Indexing (CBMI), 2022

Sara Sarto

Marcella Cornia

Lorenzo Baraldi

Rita Cucchiara

202

26 Jul 2022

Chunk-aware Alignment and Lexical Constraint for Visual Entailment with Natural Language ExplanationsACM Multimedia (ACM MM), 2022

Qian Yang

Yunxin Li

Baotian Hu

Lin Ma

Yuxin Ding

Min Zhang

240

23 Jul 2022

Zero-Shot Video Captioning with Evolving Pseudo-Tokens

Lior Wolf

233

22 Jul 2022

Efficient Modeling of Future Context for Image CaptioningACM Multimedia (ACM MM), 2022

Zhengcong Fei

Junshi Huang

Xiaoming Wei

Xiaolin K. Wei

216

22 Jul 2022

Diffsound: Discrete Diffusion Model for Text-to-sound GenerationIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

Dongchao Yang

Helin Wang

Dong Yu

285

383

20 Jul 2022

GRIT: Faster and Better Image captioning Transformer Using Dual Visual FeaturesEuropean Conference on Computer Vision (ECCV), 2022

218

148

20 Jul 2022

Explicit Image Caption EditingEuropean Conference on Computer Vision (ECCV), 2022

191

20 Jul 2022

Dual-branch Hybrid Learning Network for Unbiased Scene Graph Generation

Chao Zheng

Lianli Gao

Xinyu Lyu

Pengpeng Zeng

Abdulmotaleb El Saddik

Hengtao Shen

178

16 Jul 2022

Adaptive Fine-Grained Predicates Learning for Scene Graph GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Xinyu Lyu

Lianli Gao

Pengpeng Zeng

Hengtao Shen

Jingkuan Song

224

11 Jul 2022

Predicting Word Learning in Children from the Performance of Computer Vision SystemsAnnual Meeting of the Cognitive Science Society (CogSci), 2022

252

07 Jul 2022

Dual-Stream Transformer for Generic Event Boundary Captioning

Hanhua Ye

Yufei Wang

132

07 Jul 2022

Are metrics measuring what they should? An evaluation of image captioning task metricsSignal processing. Image communication (SPIC), 2022

Othón González-Chávez

Guillermo Ruiz

Daniela Moctezuma

Tania A. Ramirez-delreal

226

04 Jul 2022

Rethinking Surgical Captioning: End-to-End Window-Based MLP Transformer Using PatchesInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2022

Mengya Xu

Mobarakol Islam

Hongliang Ren

MedIm

180

30 Jun 2022

ZoDIAC: Zoneout Dropout Injection Attention Calculation

Zanyar Zohourianshahzadi

Terrance Boult

Jugal Kalita

293

28 Jun 2022

From Shallow to Deep: Compositional Reasoning over Graphs for Visual Question AnsweringIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Zihao Zhu

NAI ReLM GNN

245

25 Jun 2022

Scaling Autoregressive Models for Content-Rich Text-to-Image Generation

...

753

1,371

22 Jun 2022

REVECA -- Rich Encoder-decoder framework for Video Event CAptioner

104

18 Jun 2022

Coarse-to-Fine Vision-Language Pre-training with Fusion in the BackboneNeural Information Processing Systems (NeurIPS), 2022

...

296

152

15 Jun 2022

Measuring Representational Harms in Image CaptioningConference on Fairness, Accountability and Transparency (FAccT), 2022

258

14 Jun 2022

Comprehending and Ordering Semantics for Image CaptioningComputer Vision and Pattern Recognition (CVPR), 2022

Yehao Li

Yingwei Pan

Ting Yao

Tao Mei

193

114

14 Jun 2022

Language Models are General-Purpose Interfaces

226

110

13 Jun 2022

CoSe-Co: Text Conditioned Generative CommonSense ContextualizerNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

180

12 Jun 2022

Improving Image Captioning with Control Signal of Sentence QualityIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Zhangzi Zhu

Hong Qu

274

07 Jun 2022

Automated Audio Captioning with Epochal Difficult Captions for Curriculum LearningAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2022

Andrew Koh

Soham Dinesh Tiwari

Chng Eng Siong

135

04 Jun 2022

Visual Clues: Bridging Vision and Language Foundations for Image Paragraph CaptioningNeural Information Processing Systems (NeurIPS), 2022

Lu Yuan

189

03 Jun 2022

BAN-Cap: A Multi-Purpose English-Bangla Image Descriptions DatasetInternational Conference on Language Resources and Evaluation (LREC), 2022

Mohammad Faiyaz Khan

S. M. S. Shifath

Md. Saiful Islam

237

28 May 2022

GIT: A Generative Image-to-text Transformer for Vision and Language

Zicheng Liu

613

714

27 May 2022

A Survey on Long-Tailed Visual RecognitionInternational Journal of Computer Vision (IJCV), 2022

307

163

27 May 2022

Revisiting Generative Commonsense Reasoning: A Pre-Ordering Approach

Faeze Brahman

204

26 May 2022

Prompt-based Learning for Unpaired Image CaptioningIEEE transactions on multimedia (IEEE TMM), 2022

Yaowei Wang

229

26 May 2022

Fine-grained Image Captioning with CLIP Reward

391

26 May 2022

Mutual Information Divergence: A Unified Metric for Multimodal Generative ModelsNeural Information Processing Systems (NeurIPS), 2022

349

25 May 2022

Context Matters for Image Descriptions for Accessibility: Challenges for Referenceless Evaluation MetricsConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Meredith Ringel Morris

Christopher Potts

246

21 May 2022

What's in a Caption? Dataset-Specific Linguistic Diversity and Its Effect on Visual Description Models and Metrics

David M. Chan

Austin Myers

Sudheendra Vijayanarasimhan

David A. Ross

Bryan Seybold

John F. Canny

205

12 May 2022

Automated Audio Captioning: An Overview of Recent Progress and New ChallengesEURASIP Journal on Audio, Speech, and Music Processing (EURASIP J. Audio Speech Music Process.), 2022

299

12 May 2022

Beyond the Status Quo: A Contemporary Survey of Advances and Challenges in Audio CaptioningIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

286

11 May 2022

RoViST:Learning Robust Metrics for Visual Storytelling

Eileen Wang

S. Han

Josiah Poon

166

08 May 2022

Language Models Can See: Plugging Visual Controls in Text Generation

Lingpeng Kong

274

111

05 May 2022

Reducing Predictive Feature Suppression in Resource-Constrained Contrastive Image-Caption Retrieval

Maurits J. R. Bleeker

Andrew Yates

Maarten de Rijke

300

28 Apr 2022

Controllable Image Captioning

Luka Maxwell

364

28 Apr 2022

SceneTrilogy: On Human Scene-Sketch and its Complementarity with Photo and TextComputer Vision and Pattern Recognition (CVPR), 2022

Pinaki Nath Chowdhury

407

25 Apr 2022

Caption Feature Space Regularization for Audio Captioning

256

18 Apr 2022

Non-Parallel Text Style Transfer with Self-Parallel SupervisionInternational Conference on Learning Representations (ICLR), 2022

Ruibo Liu

176

18 Apr 2022

Towards Lightweight Transformer via Group-wise Transformation for Vision-and-Language TasksIEEE Transactions on Image Processing (IEEE TIP), 2022

Liujuan Cao

Yongjian Wu

Feiyue Huang

Rongrong Ji

ViT

158

16 Apr 2022

On Distinctive Image Captioning via Comparing and ReweightingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Jiuniu Wang

Wenjia Xu

Qingzhong Wang

Antoni B. Chan

188

08 Apr 2022

GEB+: A Benchmark for Generic Event Boundary Captioning, Grounding and RetrievalEuropean Conference on Computer Vision (ECCV), 2022

590

01 Apr 2022

Reproducibility Issues for BERT-based Evaluation MetricsConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Yanran Chen

Jonas Belouadi

Steffen Eger

415

30 Mar 2022