Video Captioning with Transferred Semantic Attributes

23 November 2016

Yingwei Pan

Ting Yao

Houqiang Li

Tao Mei

ArXiv (abs)PDF HTML

Papers citing "Video Captioning with Transferred Semantic Attributes"

50 / 115 papers shown

Learning to Discretely Compose Reasoning Module Networks for Video CaptioningInternational Joint Conference on Artificial Intelligence (IJCAI), 2020

Meng Wang

236

17 Jul 2020

Bifurcated backbone strategy for RGB-D salient object detection

Junwei Han

Liang Wang

248

139

06 Jul 2020

Auto-captions on GIF: A Large-scale Video-sentence Dataset for Vision-language Pre-training

Yingwei Pan

Tao Mei

210

05 Jul 2020

A Transformer-based Audio Captioning Model with Keyword Estimation

295

01 Jul 2020

SACT: Self-Aware Multi-Space Feature Composition Transformer for Multinomial Attention for Video Captioning

C. Sur

129

25 Jun 2020

Language Guided Networks for Cross-modal Moment Retrieval

Kun Liu

Huadong Ma

Chuang Gan

149

18 Jun 2020

A Better Use of Audio-Visual Cues: Dense Video Captioning with Bi-modal Transformer

Vladimir E. Iashin

Esa Rahtu

224

128

17 May 2020

Consistent Multiple Sequence Decoding

Bicheng Xu

Leonid Sigal

171

02 Apr 2020

Detection and Description of Change in Visual Streams

Davis Gilton

Ruotian Luo

Rebecca Willett

Gregory Shakhnarovich

AI4TS

181

27 Mar 2020

Multi-modal Dense Video Captioning

Vladimir E. Iashin

Esa Rahtu

325

199

17 Mar 2020

Video Caption Dataset for Describing Human Actions in JapaneseInternational Conference on Language Resources and Evaluation (LREC), 2020

110

10 Mar 2020

Better Captioning with Sequence-Level ExplorationComputer Vision and Pattern Recognition (CVPR), 2020

Jia Chen

Qin Jin

143

08 Mar 2020

On the Evaluation of Intelligent Process AutomationAAAI Conference on Artificial Intelligence (AAAI), 2019

178

08 Jan 2020

Vision and Language: from Visual Perception to Content CreationAPSIPA Transactions on Signal and Information Processing (APSIPA TSIP), 2019

Tao Mei

Wei Zhang

Ting Yao

VLM

182

26 Dec 2019

Action Modifiers: Learning from Adverbs in Instructional VideosComputer Vision and Pattern Recognition (CVPR), 2019

Hazel Doughty

Ivan Laptev

W. Mayol-Cuevas

Dima Damen

343

13 Dec 2019

Non-Autoregressive Coarse-to-Fine Video Captioning

Bang-ju Yang

Yuexian Zou

Fenglin Liu

Can Zhang

437

27 Nov 2019

Characterizing the impact of using features extracted from pre-trained models on the quality of video captioning sequence-to-sequence modelsInternational Conferences on Pattern Recognition and Artificial Intelligence (ICCPRAI), 2019

Menatallh Hammad

May Hammad

Mohamed Elshenawy

105

22 Nov 2019

Empirical Autopsy of Deep Video Captioning Frameworks

Nayyer Aafaq

Naveed Akhtar

Wei Liu

Lin Wang

119

21 Nov 2019

Low-Rank HOCA: Efficient High-Order Cross-Modal Attention for Video CaptioningConference on Empirical Methods in Natural Language Processing (EMNLP), 2019

Tao Jin

Siyu Huang

Yingming Li

Zhongfei Zhang

205

01 Nov 2019

Diverse Video Captioning Through Latent Variable ExpansionPattern Recognition Letters (PR), 2019

Huanhou Xiao

Jinglun Shi

DiffM

317

26 Oct 2019

ViP: Video Platform for PyTorch

103

07 Oct 2019

Controllable Video Captioning with POS Sequence Guidance Based on Gated Fusion NetworkIEEE International Conference on Computer Vision (ICCV), 2019

Wei Liu

227

177

27 Aug 2019

Mocycle-GAN: Unpaired Video-to-Video TranslationACM Multimedia (ACM MM), 2019

Yang Chen

Yingwei Pan

Ting Yao

Xinmei Tian

Tao Mei

GAN

177

26 Aug 2019

3-D Scene Graph: A Sparse and Semantic Representation of Physical Environments for Intelligent AgentsIEEE Transactions on Cybernetics (IEEE Trans. Cybern.), 2019

173

124

14 Aug 2019

Trends in Integration of Vision and Language Research: A Survey of Tasks, Datasets, and MethodsJournal of Artificial Intelligence Research (JAIR), 2019

407

142

22 Jul 2019

Trimmed Action Recognition, Dense-Captioning Events in Videos, and Spatio-temporal Action Localization with Focus on ActivityNet Challenge 2019

Yingwei Pan

127

14 Jun 2019

Attention is all you need for Videos: Self-attention based Video Summarization using Universal Transformers

06 Jun 2019

Reconstruct and Represent Video Contents for Captioning via Reinforcement LearningIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2019

Wei Zhang

Bairui Wang

Lin Ma

Wei Liu

184

03 Jun 2019

Aligning Visual Regions and Textual Concepts for Semantic-Grounded Image RepresentationsNeural Information Processing Systems (NeurIPS), 2019

Xuancheng Ren

228

15 May 2019

Multimodal Semantic Attention Network for Video CaptioningIEEE International Conference on Multimedia and Expo (ICME), 2019

Bing Li

166

08 May 2019

Temporal Deformable Convolutional Encoder-Decoder Networks for Video CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2019

Yingwei Pan

Tao Mei

177

104

03 May 2019

Pointing Novel Objects in Image Captioning

Yehao Li

Ting Yao

Yingwei Pan

Hongyang Chao

Tao Mei

197

25 Apr 2019

Streamlined Dense Video Captioning

256

160

08 Apr 2019

Snap and Find: Deep Discrete Cross-domain Garment Image Retrieval

Yadan Luo

Ziwei Wang

Zi Huang

Yang Yang

Huimin Lu

109

05 Apr 2019

End-to-End Video Captioning

Silvio Olivastri

Gurkirt Singh

Fabio Cuzzolin

146

04 Apr 2019

Scene Understanding for Autonomous Manipulation with Deep Learning

A. Nguyen

135

23 Mar 2019

V2CNet: A Deep Learning Framework to Translate Videos to Commands for Robotic Manipulation

Nikos G. Tsagarakis

119

23 Mar 2019

Spatio-Temporal Dynamics and Semantic Attribute Enriched Visual Encoding for Video CaptioningComputer Vision and Pattern Recognition (CVPR), 2019

Nayyer Aafaq

Naveed Akhtar

Wen Liu

Syed Zulqarnain Gilani

Lin Wang

212

220

27 Feb 2019

Hierarchical Photo-Scene Encoder for Album StorytellingAAAI Conference on Artificial Intelligence (AAAI), 2019

150

02 Feb 2019

Not All Words are Equal: Video-specific Information Loss for Video Captioning

122

01 Jan 2019

DART: Domain-Adversarial Residual-Transfer Networks for Unsupervised Cross-Domain Image Classification

30 Dec 2018

Hierarchical LSTMs with Adaptive Attention for Visual Captioning

Jingkuan Song

Xiangpeng Li

Lianli Gao

Heng Tao Shen

162

231

26 Dec 2018

Grounded Video Description

307

203

17 Dec 2018

Real-Time Referring Expression Comprehension by Single-Stage Grounding Network

181

125

09 Dec 2018

MTLE: A Multitask Learning Encoder of Visual Feature Representations for Video and Movie Description

177

19 Sep 2018

Exploring Visual Relationship for Image Captioning

Ting Yao

Yingwei Pan

Yehao Li

Tao Mei

338

893

19 Sep 2018

The ActivityNet Large-Scale Activity Recognition Challenge 2018 Summary

233

11 Aug 2018

Move Forward and Tell: A Progressive Generator of Video Descriptions

Yilei Xiong

Bo Dai

Dahua Lin

173

115

26 Jul 2018

Video Captioning with Boundary-aware Hierarchical Language Decoding and Joint Video Prediction

Xiangxi Shi

Jianfei Cai

Jiuxiang Gu

Shafiq Joty

110

08 Jul 2018

YH Technologies at ActivityNet Challenge 2018

Ting Yao

Xue Li

107

29 Jun 2018