v1v2v3v4 (latest)

Improved Image Captioning via Policy Gradient optimization of SPIDEr

1 December 2016

Papers citing "Improved Image Captioning via Policy Gradient optimization of SPIDEr"

50 / 232 papers shown

A request for clarity over the End of Sequence token in the Self-Critical Sequence TrainingInternational Conference on Image Analysis and Processing (ICIAP), 2023

J. Hu

Roberto Cavicchioli

Alessandro Capotondi

257

20 May 2023

DiffCap: Exploring Continuous Diffusion on Image Captioning

Zefan Cai

205

20 May 2023

BOLT: Fast Energy-based Controlled Text Generation with Tunable BiasesAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Xin Liu

Muhammad Khalifa

Lu Wang

328

19 May 2023

Multitask learning in Audio Captioning: a sentence embedding regression loss acts as a regularizerEuropean Signal Processing Conference (EUSIPCO), 2023

Etienne Labbé

J. Pinquier

Thomas Pellegrini

205

02 May 2023

Towards Explainable and Safe Conversational Agents for Mental Health: A Survey

158

25 Apr 2023

A Cubic-regularized Policy Newton Algorithm for Reinforcement LearningInternational Conference on Artificial Intelligence and Statistics (AISTATS), 2023

Mizhaan Prajit Maniyar

Akash Mondal

Prashanth L.A.

S. Bhatnagar

183

21 Apr 2023

Graph Attention for Automated Audio CaptioningIEEE Signal Processing Letters (IEEE SPL), 2023

197

07 Apr 2023

Prefix tuning for automated audio captioningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

Minkyu Kim

Kim Sung-Bin

Tae-Hyun Oh

353

30 Mar 2023

WavCaps: A ChatGPT-Assisted Weakly-Labelled Audio Captioning Dataset for Audio-Language Multimodal ResearchIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

337

306

30 Mar 2023

ImageAssist: Tools for Enhancing Touchscreen-Based Image Exploration Systems for Blind and Low Vision UsersInternational Conference on Human Factors in Computing Systems (CHI), 2023

Vishnu Nair

Han Zhu

Brian A. Smith

158

17 Feb 2023

Semantics-Empowered Communication: A Tutorial-cum-Survey

528

16 Dec 2022

Impact of visual assistance for automated audio captioning

Wim Boes

Hugo Van hamme

192

18 Nov 2022

Is my automatic audio captioning system so bad? spider-max: a metric to consider several caption candidatesWorkshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2022

Etienne Labbé

Thomas Pellegrini

J. Pinquier

106

14 Nov 2022

Exploring Train and Test-Time Augmentations for Audio-Language Learning

167

31 Oct 2022

Hybrid Reinforced Medical Report Generation with M-Linear Attention and Repetition PenaltyIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

174

14 Oct 2022

Automated Audio Captioning via Fusion of Low- and High- Dimensional Features

176

10 Oct 2022

Vision+X: A Survey on Multimodal Learning in the Light of DataIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Ye Zhu

Yuehua Wu

Andrii Zadaianchuk

Yan Yan

354

05 Oct 2022

Is Reinforcement Learning (Not) for Natural Language Processing: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization

Rajkumar Ramamurthy

Prithviraj Ammanabrolu

Yejin Choi

565

279

03 Oct 2022

Paraphrasing Is All You Need for Novel Object CaptioningNeural Information Processing Systems (NeurIPS), 2022

Louis-Philippe Morency

Yu-Chiang Frank Wang

184

25 Sep 2022

Show, Interpret and Tell: Entity-aware Contextualised Image Captioning in WikipediaAAAI Conference on Artificial Intelligence (AAAI), 2022

189

21 Sep 2022

An investigation on selecting audio pre-trained models for audio captioning

Peiran Yan

Sheng-Wei Li

126

12 Aug 2022

Is GPT-3 all you need for Visual Question Answering in Cultural Heritage?

P. Bongini

Federico Becattini

Marco Bertini

206

25 Jul 2022

Rethinking the Reference-based Distinctive Image CaptioningACM Multimedia (ACM MM), 2022

225

22 Jul 2022

Efficient Modeling of Future Context for Image CaptioningACM Multimedia (ACM MM), 2022

Zhengcong Fei

Junshi Huang

Xiaoming Wei

Xiaolin K. Wei

208

22 Jul 2022

Automated Audio Captioning and Language-Based Audio Retrieval

297

08 Jul 2022

Automated Audio Captioning: An Overview of Recent Progress and New ChallengesEURASIP Journal on Audio, Speech, and Music Processing (EURASIP J. Audio Speech Music Process.), 2022

290

12 May 2022

Caption Feature Space Regularization for Audio Captioning

202

18 Apr 2022

Towards Lightweight Transformer via Group-wise Transformation for Vision-and-Language TasksIEEE Transactions on Image Processing (IEEE TIP), 2022

Liujuan Cao

Yongjian Wu

Feiyue Huang

Rongrong Ji

ViT

153

16 Apr 2022

Interactive Audio-text Representation for Automated Audio Captioning with Contrastive Learning

Chen Chen

Yuchen Hu

188

29 Mar 2022

Leveraging Pre-trained BERT for Audio CaptioningEuropean Signal Processing Conference (EUSIPCO), 2022

267

06 Mar 2022

CaMEL: Mean Teacher Learning for Image CaptioningInternational Conference on Pattern Recognition (ICPR), 2022

Lorenzo Baraldi

194

21 Feb 2022

Joint Speech Recognition and Audio CaptioningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

130

03 Feb 2022

Deep Learning Approaches on Image Captioning: A ReviewACM Computing Surveys (ACM CSUR), 2022

480

150

31 Jan 2022

Local Information Assisted Attention-free Decoder for Audio CaptioningIEEE Signal Processing Letters (SPL), 2022

270

10 Jan 2022

A Survey of Natural Language GenerationACM Computing Surveys (CSUR), 2021

Min Yang

336

22 Dec 2021

Evaluating Off-the-Shelf Machine Listening and Natural Language Models for Automated Audio Captioning

Benno Weck

Xavier Favory

Konstantinos Drossos

Xavier Serra

140

14 Oct 2021

Audio Captioning Using Sound Event Detection

Aycsegul Ozkaya Eren

M. Sert

168

04 Oct 2021

CIDEr-R: Robust Consensus-based Image Description Evaluation

G. O. D. Santos

Esther Luna Colombini

Sandra Avila

151

28 Sep 2021

Reinforcement Learning-powered Semantic Communication via Semantic Similarity

157

27 Aug 2021

Medical-VLBERT: Medical Visual Language BERT for COVID-19 CT Report Generation With Alternate LearningIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2021

...

Xiang Wan

274

11 Aug 2021

Automated Audio Captioning using Transfer Learning and Reconstruction Latent Space Similarity RegularizationIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Andrew Koh

Fuzhao Xue

Chng Eng Siong

129

10 Aug 2021

An Encoder-Decoder Based Audio Captioning System With Transfer and Reinforcement LearningWorkshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2021

...

182

05 Aug 2021

Continual Learning for Automated Audio Captioning Using The Learning Without Forgetting ApproachWorkshop on Detection and Classification of Acoustic Scenes and Events (DCASE), 2021

Jan van den Berg

Konstantinos Drossos

CLL

140

16 Jul 2021

From Show to Tell: A Survey on Deep Learning-based Image CaptioningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Lorenzo Baraldi

435

344

14 Jul 2021

Don't Take It Literally: An Edit-Invariant Sequence Loss for Text GenerationNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

Xiaodan Liang

389

29 Jun 2021

SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality AnalysisAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Joshua Forster Feinglass

Yezhou Yang

02 Jun 2021

Longer Version for "Deep Context-Encoding Network for Retinal Image Captioning"

160

30 May 2021

Contextualized Keyword Representations for Multi-modal Retinal Image CaptioningInternational Conference on Multimedia Retrieval (ICMR), 2021

243

26 Apr 2021

MusCaps: Generating Captions for Music AudioIEEE International Joint Conference on Neural Network (IJCNN), 2021

281

24 Apr 2021

Towards Accurate Text-based Image Captioning with Content Diversity ExplorationComputer Vision and Pattern Recognition (CVPR), 2021

Qi Wu

233

23 Apr 2021