Deep Captioning with Multimodal Recurrent Neural Networks (m-RNN)

20 December 2014

Yi Yang

Papers citing "Deep Captioning with Multimodal Recurrent Neural Networks (m-RNN)"

50 / 417 papers shown

Title
Review of state-of-the-arts in artificial intelligence with application to AI safety problem V. Shakirov 12 10 0 11 May 2016
Leveraging Visual Question Answering for Image-Caption Ranking Xiaoyu Lin Devi Parikh CoGe 6 83 0 04 May 2016
Improving Image Captioning by Concept-based Sentence Reranking Xirong Li Qin Jin 10 5 0 03 May 2016
Word2VisualVec: Image and Video to Sentence Matching by Visual Feature Prediction Jianfeng Dong Xirong Li Cees G. M. Snoek 3DV 11 35 0 23 Apr 2016
CNN-RNN: A Unified Framework for Multi-label Image Classification Jiang Wang Yi Yang Junhua Mao Zhiheng Huang Chang Huang W. Xu SSL 9 1,162 0 15 Apr 2016
Attributes as Semantic Units between Natural Language and Visual Recognition Marcus Rohrbach VLM 14 3 0 12 Apr 2016
TGIF: A New Dataset and Benchmark on Animated GIF Description Yuncheng Li Yale Song Liangliang Cao Joel R. Tetreault Larry Goldberg A. Jaimes Jiebo Luo 9 269 0 10 Apr 2016
Image Captioning with Deep Bidirectional LSTMs Cheng Wang Haojin Yang Christian Bartz Christoph Meinel VLM 10 278 0 04 Apr 2016
Automatic Annotation of Structured Facts in Images Mohamed Elhoseiny Scott D. Cohen W. Chang Brian L. Price Ahmed Elgammal 8 9 0 02 Apr 2016
Multi-Cue Zero-Shot Learning with Strong Supervision Zeynep Akata Mateusz Malinowski Mario Fritz Bernt Schiele 24 148 0 29 Mar 2016
BreakingNews: Article Annotation by Image and Text Processing Arnau Ramisa F. Yan Francesc Moreno-Noguer K. Mikolajczyk 21 105 0 23 Mar 2016
Segmentation from Natural Language Expressions Ronghang Hu Marcus Rohrbach Trevor Darrell VLM EgoV 19 426 0 20 Mar 2016
Image Captioning with Semantic Attention Quanzeng You Hailin Jin Zhaowen Wang Chen Fang Jiebo Luo VLM 9 1,651 0 12 Mar 2016
Image Captioning and Visual Question Answering Based on Attributes and External Knowledge Qi Wu Chunhua Shen A. Hengel Peng Wang A. Dick 11 360 0 09 Mar 2016
Lie Access Neural Turing Machine Greg Yang KELM 9 17 0 28 Feb 2016
Learning Distributed Representations of Sentences from Unlabelled Data Felix Hill Kyunghyun Cho Anna Korhonen SSL 14 570 0 10 Feb 2016
A Taxonomy of Deep Convolutional Neural Nets for Computer Vision Suraj Srinivas Ravi Kiran Sarvadevabhatla Konda Reddy Mopuri N. Prabhu S. Kruthiventi R. Venkatesh Babu OOD 20 215 0 25 Jan 2016
Automatic Description Generation from Images: A Survey of Models, Datasets, and Evaluation Measures Raffaella Bernardi Ruken Cakici Desmond Elliott Aykut Erdem Erkut Erdem Nazli Ikizler-Cinbis Frank Keller A. Muscat Barbara Plank EGVM VLM 6 363 0 15 Jan 2016
Write a Classifier: Predicting Visual Classifiers from Unstructured Text Mohamed Elhoseiny Ahmed Elgammal Babak Saleh 20 41 0 31 Dec 2015
RNN Fisher Vectors for Action Recognition and Image Annotation Guy Lev Gil Sadeh Benjamin Klein Lior Wolf 9 163 0 12 Dec 2015
Simple Baseline for Visual Question Answering Bolei Zhou Yuandong Tian Sainbayar Sukhbaatar Arthur Szlam Rob Fergus FAtt 13 324 0 07 Dec 2015
A Restricted Visual Turing Test for Deep Scene and Event Understanding Qi Tianfu Wu M. Lee Song-Chun Zhu 14 12 0 06 Dec 2015
Attribute2Image: Conditional Image Generation from Visual Attributes Xinchen Yan Jimei Yang Kihyuk Sohn Honglak Lee DRL GAN 17 767 0 02 Dec 2015
Where To Look: Focus Regions for Visual Question Answering Kevin J. Shih Saurabh Singh Derek Hoiem 12 457 0 23 Nov 2015
Ask Me Anything: Free-form Visual Question Answering Based on Knowledge from External Sources Qi Wu Peng Wang Chunhua Shen A. Dick A. Hengel 14 370 0 22 Nov 2015
Order Matters: Sequence to sequence for sets Oriol Vinyals Samy Bengio M. Kudlur BDL 8 946 0 19 Nov 2015
Order-Embeddings of Images and Language Ivan Vendrov Ryan Kiros Sanja Fidler R. Urtasun 15 542 0 19 Nov 2015
Generating Sentences from a Continuous Space Samuel R. Bowman Luke Vilnis Oriol Vinyals Andrew M. Dai Rafal Jozefowicz Samy Bengio DRL 15 2,340 0 19 Nov 2015
Learning Deep Structure-Preserving Image-Text Embeddings Liwei Wang Yin Li Svetlana Lazebnik 27 780 0 19 Nov 2015
ABC-CNN: An Attention Based Convolutional Neural Network for Visual Question Answering Kan Chen Jiang Wang Liang-Chieh Chen Haoyuan Gao W. Xu Ram Nevatia 14 286 0 18 Nov 2015
Learning Articulated Motion Models from Visual and Lingual Signals Zhengyang Wu Mohit Bansal Matthew R. Walter 17 0 0 17 Nov 2015
Sherlock: Scalable Fact Learning in Images Mohamed Elhoseiny Scott D. Cohen W. Chang Brian L. Price Ahmed Elgammal 8 26 0 16 Nov 2015
Oracle performance for visual captioning L. Yao Nicolas Ballas Kyunghyun Cho John R. Smith Yoshua Bengio VLM 28 8 0 14 Nov 2015
Natural Language Object Retrieval Ronghang Hu Huazhe Xu Marcus Rohrbach Jiashi Feng Kate Saenko Trevor Darrell ObjD 32 551 0 13 Nov 2015
Generative Concatenative Nets Jointly Learn to Write and Classify Reviews Zachary Chase Lipton Sharad Vikram Julian McAuley BDL 17 32 0 11 Nov 2015
Generation and Comprehension of Unambiguous Object Descriptions Junhua Mao Jonathan Huang Alexander Toshev Oana-Maria Camburu Alan Yuille Kevin Patrick Murphy ObjD 16 1,309 0 07 Nov 2015
Stacked Attention Networks for Image Question Answering Zichao Yang Xiaodong He Jianfeng Gao Li Deng Alex Smola BDL 16 1,867 0 07 Nov 2015
Video Paragraph Captioning Using Hierarchical Recurrent Neural Networks Haonan Yu Jiang Wang Zhiheng Huang Yi Yang W. Xu 42 560 0 26 Oct 2015
Multilingual Image Description with Neural Sequence Models Desmond Elliott Stella Frank Eva Hasler VLM 12 75 0 15 Oct 2015
A Diversity-Promoting Objective Function for Neural Conversation Models Jiwei Li Michel Galley Chris Brockett Jianfeng Gao W. Dolan 15 2,360 0 11 Oct 2015
SentiCap: Generating Image Descriptions with Sentiments A. Mathews Lexing Xie Xuming He 18 221 0 06 Oct 2015
Guiding Long-Short Term Memory for Image Caption Generation Xu Jia E. Gavves Basura Fernando Tinne Tuytelaars VLM 14 101 0 16 Sep 2015
Learning Contextual Dependencies with Convolutional Hierarchical Recurrent Neural Networks Zhen Zuo Bing Shuai G. Wang Xiao Liu Xingxing Wang B. Wang 11 93 0 13 Sep 2015
Describing Multimedia Content using Attention-based Encoder--Decoder Networks Kyunghyun Cho Aaron Courville Yoshua Bengio 32 410 0 04 Jul 2015
Skip-Thought Vectors Ryan Kiros Yukun Zhu Ruslan Salakhutdinov R. Zemel Antonio Torralba R. Urtasun Sanja Fidler SSL 11 2,400 0 22 Jun 2015
Compressing Convolutional Neural Networks Wenlin Chen James T. Wilson Stephen Tyree Kilian Q. Weinberger Yixin Chen 19 139 0 14 Jun 2015
Listen, Attend, and Walk: Neural Mapping of Navigational Instructions to Action Sequences Hongyuan Mei Mohit Bansal Matthew R. Walter LM&Ro 13 242 0 12 Jun 2015
Scheduled Sampling for Sequence Prediction with Recurrent Neural Networks Samy Bengio Oriol Vinyals Navdeep Jaitly Noam M. Shazeer 21 2,017 0 09 Jun 2015
The Long-Short Story of Movie Description Anna Rohrbach Marcus Rohrbach Bernt Schiele VLM 20 110 0 04 Jun 2015
What value do explicit high level concepts have in vision to language problems? Qi Wu Chunhua Shen Lingqiao Liu A. Dick A. Hengel 22 443 0 03 Jun 2015