Discriminability objective for training descriptive captions

12 March 2018

Ruotian Luo

Brian L. Price

Scott D. Cohen

Gregory Shakhnarovich

ArXiv PDF HTML

Papers citing "Discriminability objective for training descriptive captions"

33 / 33 papers shown

Title
Group-based Distinctive Image Captioning with Memory Difference Encoding and Attention Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 38 0 0 03 Apr 2025
No Detail Left Behind: Revisiting Self-Retrieval for Fine-Grained Image Captioning Manu Gaur Darshan Singh Makarand Tapaswi 92 1 0 04 Sep 2024
Effective End-to-End Vision Language Pretraining with Semantic Visual Loss Xiaofeng Yang Fayao Liu Guosheng Lin VLM 19 7 0 18 Jan 2023
Text-Guided Mask-free Local Image Retouching Zerun Liu Fan Zhang Jingxuan He Jin Wang Zhangye Wang Lechao Cheng DiffM 22 5 0 15 Dec 2022
Learning to Collocate Visual-Linguistic Neural Modules for Image Captioning Xu Yang Hanwang Zhang Chongyang Gao Jianfei Cai MLLM 25 10 0 04 Oct 2022
Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2 Xinghui Zhou Xin Jin Jianwen Lv Heng Huang Ming Mao Shuai Cui CoGe 16 0 0 09 Aug 2022
On Distinctive Image Captioning via Comparing and Reweighting Jiuniu Wang Wenjia Xu Qingzhong Wang Antoni B. Chan 30 16 0 08 Apr 2022
An Integrated Approach for Video Captioning and Applications Soheyla Amirian T. Taha Khaled Rasheed H. Arabnia 26 1 0 23 Jan 2022
Injecting Semantic Concepts into End-to-End Image Captioning Zhiyuan Fang Jianfeng Wang Xiaowei Hu Lin Liang Zhe Gan Lijuan Wang Yezhou Yang Zicheng Liu ViT VLM 19 86 0 09 Dec 2021
D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding Dave Zhenyu Chen Qirui Wu Matthias Nießner Angel X. Chang 19 29 0 02 Dec 2021
Retrieve, Caption, Generate: Visual Grounding for Enhancing Commonsense in Text Generation Models Steven Y. Feng Kevin Lu Zhuofu Tao Malihe Alikhani Teruko Mitamura Eduard H. Hovy Varun Gangal LRM 25 13 0 08 Sep 2021
How Much Can CLIP Benefit Vision-and-Language Tasks? Sheng Shen Liunian Harold Li Hao Tan Mohit Bansal Anna Rohrbach Kai-Wei Chang Z. Yao Kurt Keutzer CLIP VLM MLLM 188 405 0 13 Jul 2021
UMIC: An Unreferenced Metric for Image Captioning via Contrastive Learning Hwanhee Lee Seunghyun Yoon Franck Dernoncourt Trung Bui Kyomin Jung VLM 19 44 0 26 Jun 2021
Understanding and Evaluating Racial Biases in Image Captioning Dora Zhao Angelina Wang Olga Russakovsky 13 134 0 16 Jun 2021
CLIPScore: A Reference-free Evaluation Metric for Image Captioning Jack Hessel Ari Holtzman Maxwell Forbes Ronan Le Bras Yejin Choi CLIP 13 1,434 0 18 Apr 2021
Automatic Generation of Descriptive Titles for Video Clips Using Deep Learning Soheyla Amirian Khaled Rasheed T. Taha H. Arabnia VLM VGen 14 23 0 07 Apr 2021
Human-like Controllable Image Captioning with Verb-specific Semantic Roles Long Chen Zhihong Jiang Jun Xiao Wei Liu 10 74 0 22 Mar 2021
Causal Attention for Vision-Language Tasks Xu Yang Hanwang Zhang Guojun Qi Jianfei Cai CML 23 148 0 05 Mar 2021
Multi-modal Ensemble Models for Predicting Video Memorability Tony Zhao Irving Fang Jeffrey Kim Gerald Friedland 11 5 0 01 Feb 2021
Dual Attention on Pyramid Feature Maps for Image Captioning Litao Yu Jian Andrew Zhang Qiang Wu 11 47 0 02 Nov 2020
A Better Variant of Self-Critical Sequence Training Ruotian Luo BDL 14 37 0 22 Mar 2020
Better Captioning with Sequence-Level Exploration Jia Chen Qin Jin 29 12 0 08 Mar 2020
Show, Recall, and Tell: Image Captioning with Recall Mechanism Li Wang Zechen Bai Yonghua Zhang Hongtao Lu 14 67 0 15 Jan 2020
Unpaired Cross-lingual Image Caption Generation with Self-Supervised Rewards Yuqing Song Shizhe Chen Yida Zhao Qin Jin SSL 21 40 0 15 Aug 2019
Aligning Linguistic Words and Visual Semantic Units for Image Captioning Longteng Guo Jing Liu Jinhui Tang Jiangwei Li W. Luo Hanqing Lu 9 102 0 06 Aug 2019
Aesthetic Attributes Assessment of Images Xin Jin Le Wu Geng Zhao Xiaodong Li Xiaokun Zhang Shiming Ge Dongqing Zou Bin Zhou Xinghui Zhou 15 36 0 11 Jul 2019
Deep Metric Learning Beyond Binary Supervision Sungyeon Kim Minkyo Seo Ivan Laptev Minsu Cho Suha Kwak SSL 15 94 0 21 Apr 2019
Learning to Collocate Neural Modules for Image Captioning Xu Yang Hanwang Zhang Jianfei Cai 11 77 0 18 Apr 2019
Reasoning Visual Dialogs with Structural and Partial Observations Zilong Zheng Wenguan Wang Siyuan Qi Song-Chun Zhu 28 117 0 11 Apr 2019
Describing like humans: on diversity in image captioning Qingzhong Wang Antoni B. Chan 19 97 0 28 Mar 2019
Evaluating Text-to-Image Matching using Binary Image Selection (BISON) Hexiang Hu Ishan Misra L. V. D. van der Maaten 16 22 0 19 Jan 2019
Auto-Encoding Scene Graphs for Image Captioning Xu Yang Kaihua Tang Hanwang Zhang Jianfei Cai 13 692 0 06 Dec 2018
Fast, Diverse and Accurate Image Captioning Guided By Part-of-Speech Aditya Deshpande J. Aneja Liwei Wang A. Schwing David A. Forsyth 6 146 0 31 May 2018