v1v2v3 (latest)

Translating Videos to Natural Language Using Deep Recurrent Neural Networks

North American Chapter of the Association for Computational Linguistics (NAACL), 2014

15 December 2014

Subhashini Venugopalan

Papers citing "Translating Videos to Natural Language Using Deep Recurrent Neural Networks"

34 / 334 papers shown

Stories in the Eye: Contextual Visual Interactions for Efficient Video to Language Translation

Anirudh Goyal

Marius Leordeanu

102

20 Nov 2015

Delving Deeper into Convolutional Networks for Learning Video Representations

Aaron Courville

296

757

19 Nov 2015

Learning Deep Structure-Preserving Image-Text Embeddings

Liwei Wang

Yin Li

Svetlana Lazebnik

479

820

19 Nov 2015

ABC-CNN: An Attention Based Convolutional Neural Network for Visual Question Answering

264

298

18 Nov 2015

Structural-RNN: Deep Learning on Spatio-Temporal Graphs

Silvio Savarese

457

1,154

17 Nov 2015

Deep Compositional Captioning: Describing Novel Object Categories without Paired Training Data

Lisa Anne Hendricks

Subhashini Venugopalan

304

290

17 Nov 2015

Ask, Attend and Answer: Exploring Question-Guided Spatial Attention for Visual Question Answering

Huijuan Xu

Kate Saenko

378

780

17 Nov 2015

Oracle performance for visual captioning

432

14 Nov 2015

Action Recognition using Visual Attention

Shikhar Sharma

Ryan Kiros

Ruslan Salakhutdinov

340

677

12 Nov 2015

Deep Gaussian Conditional Random Field Network: A Model-based Deep Network for Discriminative Denoising

Raviteja Vemulapalli

Oncel Tuzel

Ming-Yuan Liu

143

12 Nov 2015

Generative Concatenative Nets Jointly Learn to Write and Classify Reviews

Zachary Chase Lipton

Sharad Vikram

Julian McAuley

BDL

275

11 Nov 2015

Hierarchical Recurrent Neural Encoder for Video Representation with Application to Captioning

Yi Yang

154

391

11 Nov 2015

VideoStory Embeddings Recognize Events when Examples are Scarce

A. Habibian

Thomas Mensink

Cees G. M. Snoek

171

08 Nov 2015

Privacy Prediction of Images Shared on Social Media Sites Using Deep Features

Ashwini Tonge

Cornelia Caragea

163

29 Oct 2015

Video Paragraph Captioning Using Hierarchical Recurrent Neural Networks

Yi Yang

360

573

26 Oct 2015

Learning Contextual Dependencies with Convolutional Hierarchical Recurrent Neural Networks

209

102

13 Sep 2015

Describing Multimedia Content using Attention-based Encoder--Decoder Networks

Dong Wang

Aaron Courville

Yoshua Bengio

202

432

04 Jul 2015

A Survey of Current Datasets for Vision and Language Research

Francis Ferraro

N. Mostafazadeh

Ting-Hao 'Kenneth' Huang

160

23 Jun 2015

Aligning Books and Movies: Towards Story-like Visual Explanations by Watching Movies and Reading Books

Antonio Torralba

Sanja Fidler

541

2,683

22 Jun 2015

Learning language through picturesAnnual Meeting of the Association for Computational Linguistics (ACL), 2015

217

11 Jun 2015

The Long-Short Story of Movie DescriptionGerman Conference on Pattern Recognition (DAGM), 2015

Anna Rohrbach

Marcus Rohrbach

Bernt Schiele

VLM

143

117

04 Jun 2015

Visual Madlibs: Fill in the blank Image Generation and Question Answering

249

31 May 2015

A Multi-scale Multiple Instance Video Description Network

Huijuan Xu

Subhashini Venugopalan

Vasili Ramanishka

Marcus Rohrbach

Kate Saenko

243

21 May 2015

Jointly Modeling Embedding and Translation to Bridge Video and Language

Yingwei Pan

Tao Mei

Ting Yao

Houqiang Li

Y. Rui

228

544

07 May 2015

Ask Your Neurons: A Neural-based Approach to Answering Questions about Images

Mateusz Malinowski

Marcus Rohrbach

Mario Fritz

374

629

05 May 2015

Sequence to Sequence -- Video to Text

Subhashini Venugopalan

389

1,469

03 May 2015

Differential Recurrent Neural Networks for Action Recognition

Vivek Veeriah

Naifan Zhuang

Guo-Jun Qi

260

482

25 Apr 2015

Evaluating Two-Stream CNN for Video ClassificationInternational Conference on Multimedia Retrieval (ICMR), 2015

Zuxuan Wu

133

121

08 Apr 2015

Modeling Spatial-Temporal Clues in a Hybrid Deep Learning Framework for Video ClassificationACM Multimedia (ACM MM), 2015

Zuxuan Wu

168

460

07 Apr 2015

Using Descriptive Video Services to Create a Large Data Source for Video Annotation Research

Aaron Courville

256

211

03 Mar 2015

Describing Videos by Exploiting Temporal Structure

Aaron Courville

474

1,094

27 Feb 2015

Phrase-based Image Captioning

226

123

12 Feb 2015

A Dataset for Movie Description

Bernt Schiele

271

539

12 Jan 2015

Long-term Recurrent Convolutional Networks for Visual Recognition and DescriptionComputer Vision and Pattern Recognition (CVPR), 2014

Jeff Donahue

Lisa Anne Hendricks

Marcus Rohrbach

Subhashini Venugopalan

693

6,278

17 Nov 2014