v1v2v3 (latest)

Jointly Modeling Embedding and Translation to Bridge Video and Language

7 May 2015

Yingwei Pan

Tao Mei

Papers citing "Jointly Modeling Embedding and Translation to Bridge Video and Language"

49 / 199 papers shown

PassGAN: A Deep Learning Approach for Password Guessing

238

284

01 Sep 2017

Video Captioning with Guidance of Multimodal Latent Topics

Shizhe Chen

Jia Chen

Qin Jin

Alexander G. Hauptmann

207

31 Aug 2017

Generating Video Descriptions with Topic Guidance

Shizhe Chen

Jia Chen

Qin Jin

156

31 Aug 2017

Incorporating Copying Mechanism in Image Captioning for Learning Novel Objects

Ting Yao

Yingwei Pan

Yehao Li

Tao Mei

VLM

141

154

17 Aug 2017

ConvNet Architecture Search for Spatiotemporal Feature Learning

196

411

16 Aug 2017

VQS: Linking Segmentations to Questions and Answers for Supervised Attention in VQA and Question-Focused Semantic SegmentationIEEE International Conference on Computer Vision (ICCV), 2017

Chuang Gan

243

136

15 Aug 2017

Hierarchically-Attentive RNN for Album Summarization and StorytellingConference on Empirical Methods in Natural Language Processing (EMNLP), 2017

Licheng Yu

Joey Tianyi Zhou

Tamara L. Berg

108

09 Aug 2017

From Deterministic to Generative: Multi-Modal Stochastic RNNs for Video CaptioningIEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS), 2017

Jingkuan Song

Yuyu Guo

Lianli Gao

Xuelong Li

Alan Hanjalic

Heng Tao Shen

174

228

08 Aug 2017

Reinforced Video Captioning with Entailment RewardsConference on Empirical Methods in Natural Language Processing (EMNLP), 2017

Ramakanth Pasunuru

Joey Tianyi Zhou

157

118

07 Aug 2017

Localizing Moments in Video with Natural Language

404

1,102

04 Aug 2017

Learning Fashion Compatibility with Bidirectional LSTMs

Xintong Han

Zuxuan Wu

Yu-Gang Jiang

L. Davis

181

392

18 Jul 2017

Show and Recall: Learning What Makes Videos Memorable

130

17 Jul 2017

Hierarchical LSTM with Adjusted Temporal Attention for Video CaptioningInternational Joint Conference on Artificial Intelligence (IJCAI), 2017

Jingkuan Song

Lianli Gao

176

169

05 Jun 2017

Weakly supervised 3D Reconstruction with Adversarial ConstraintInternational Conference on 3D Vision (3DV), 2017

Silvio Savarese

219

123

31 May 2017

Multimodal Machine Learning: A Survey and Taxonomy

T. Baltrušaitis

Chaitanya Ahuja

Louis-Philippe Morency

534

3,572

26 May 2017

Unified Embedding and Metric Learning for Zero-Exemplar Event Detection

Noureldien Hussein

E. Gavves

A. Smeulders

113

05 May 2017

Dense-Captioning Events in Videos

Li Fei-Fei

400

1,439

02 May 2017

Multi-Task Video Captioning with Video and Entailment Generation

Ramakanth Pasunuru

Joey Tianyi Zhou

186

120

24 Apr 2017

Deep Reinforcement Learning-based Image Captioning with Embedding Reward

146

334

12 Apr 2017

Weakly Supervised Dense Video Captioning

183

140

05 Apr 2017

TS-LSTM and Temporal-Inception: Exploiting Spatiotemporal Dynamics for Activity Recognition

199

252

30 Mar 2017

Improving Interpretability of Deep Neural Networks with Semantic Information

Yinpeng Dong

Hang Su

Jun Zhu

Bo Zhang

194

130

12 Mar 2017

Contextually Customized Video Summaries via Natural Language

Jinsoo Choi

Tae-Hyun Oh

In So Kweon

168

06 Feb 2017

Attention-Based Multimodal Fusion for Video DescriptionIEEE International Conference on Computer Vision (ICCV), 2017

319

379

11 Jan 2017

Video Captioning with Multi-Faceted Attention

Xiang Long

Chuang Gan

Gerard de Melo

177

01 Dec 2016

Hierarchical Boundary-Aware Neural Encoder for Video Captioning

Lorenzo Baraldi

C. Grana

Rita Cucchiara

271

196

28 Nov 2016

Bidirectional Multirate Reconstruction for Temporal Modeling in Videos

Linchao Zhu

Zhongwen Xu

Yi Yang

158

28 Nov 2016

Semantic Compositional Networks for Visual Captioning

Chuang Gan

Lawrence Carin

Li Deng

CoGe

269

444

23 Nov 2016

Adaptive Feature Abstraction for Translating Video to Text

Yunchen Pu

Martin Renqiang Min

Zhe Gan

Lawrence Carin

190

23 Nov 2016

Video Captioning with Transferred Semantic Attributes

Yingwei Pan

Ting Yao

Houqiang Li

Tao Mei

166

337

23 Nov 2016

Dense Captioning with Joint Inference and Visual Context

214

177

21 Nov 2016

Recurrent Memory Addressing for describing videos

A. Jain

Abhinav Agarwalla

Kumar Krishna Agrawal

Pabitra Mitra

132

20 Nov 2016

Multimodal Memory Modelling for Video Captioning

Liang Wang

203

147

17 Nov 2016

Learning long-term dependencies for action recognition with a biologically-inspired deep network

Yemin Shi

Yonghong Tian

Yaowei Wang

Tiejun Huang

194

16 Nov 2016

Leveraging Video Descriptions to Learn Video Question Answering

266

188

12 Nov 2016

Memory-augmented Attention Modelling for Videos

261

07 Nov 2016

Boosting Image Captioning with Attributes

Yingwei Pan

Tao Mei

293

648

05 Nov 2016

Spatio-Temporal Attention Models for Grounded Video Captioning

M. Zanfir

Elisabeta Marinoiu

C. Sminchisescu

213

17 Oct 2016

Learning Spatial-Semantic Context with Fully Convolutional Recurrent Network for Online Handwritten Chinese Text RecognitionIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2016

Lianwen Jin

188

128

09 Oct 2016

Deep Learning for Video Classification and Captioning

Zuxuan Wu

176

139

22 Sep 2016

Title Generation for User Generated VideosEuropean Conference on Computer Vision (ECCV), 2016

168

25 Aug 2016

Bidirectional Long-Short Term Memory for Video Description

Zi Huang

Xing Xu

159

15 Jun 2016

Beyond Caption To Narrative: Video Captioning With Multiple Sentences

Andrew Shin

Katsunori Ohnishi

Tatsuya Harada

131

18 May 2016

Aaron Courville

Bernt Schiele

3DV VGen

266

387

12 May 2016

TGIF: A New Dataset and Benchmark on Animated GIF Description

199

295

10 Apr 2016

A Taxonomy of Deep Convolutional Neural Nets for Computer Vision

Suraj Srinivas

Ravi Kiran Sarvadevabhatla

181

219

25 Jan 2016

Hierarchical Recurrent Neural Encoder for Video Representation with Application to Captioning

Yi Yang

154

391

11 Nov 2015

Video Paragraph Captioning Using Hierarchical Recurrent Neural Networks

Yi Yang

360

573

26 Oct 2015

The Long-Short Story of Movie DescriptionGerman Conference on Pattern Recognition (DAGM), 2015

Anna Rohrbach

Marcus Rohrbach

Bernt Schiele

VLM

143

117

04 Jun 2015