v1v2v3 (latest)

Show, Attend and Tell: Neural Image Caption Generation with Visual Attention

10 February 2015

Jimmy Ba

Aaron Courville

Papers citing "Show, Attend and Tell: Neural Image Caption Generation with Visual Attention"

50 / 3,580 papers shown

phi-LSTM: A Phrase-based Hierarchical LSTM Model for Image CaptioningAsian Conference on Computer Vision (ACCV), 2016

Y. Tan

Chee Seng Chan

VLM

332

20 Aug 2016

RETAIN: An Interpretable Predictive Model for Healthcare using Reverse Time Attention MechanismNeural Information Processing Systems (NeurIPS), 2016

Jimeng Sun

511

1,394

19 Aug 2016

Modeling Human Reading with Neural AttentionConference on Empirical Methods in Natural Language Processing (EMNLP), 2016

Michael Hahn

Frank Keller

188

19 Aug 2016

Seeing with Humans: Gaze-Assisted Neural Image Captioning

Yusuke Sugano

Andreas Bulling

221

18 Aug 2016

Temporal Attention Model for Neural Machine Translation

105

09 Aug 2016

End-to-End Localization and Ranking for Relative Attributes

Krishna Kumar Singh

Yong Jae Lee

210

09 Aug 2016

Learning Online Alignments with Continuous Rewards Policy Gradient

173

03 Aug 2016

Modeling Context Between Objects for Referring Expression Understanding

Varun K. Nagaraja

Vlad I. Morariu

Larry S. Davis

304

230

01 Aug 2016

Modeling Context in Referring Expressions

574

1,527

31 Jul 2016

SPICE: Semantic Propositional Image Caption Evaluation

422

2,166

29 Jul 2016

Salient Object Subitizing

161

118

26 Jul 2016

Learning Aligned Cross-Modal Representations from Weakly Aligned Data

Carl Vondrick

Antonio Torralba

168

177

25 Jul 2016

An Actor-Critic Algorithm for Sequence Prediction

Aaron Courville

319

660

24 Jul 2016

Spatio-Temporal LSTM with Trust Gates for 3D Human Action Recognition

357

1,185

24 Jul 2016

Hierarchical Attention Network for Action Recognition in Videos

113

21 Jul 2016

Constructing a Natural Language Inference Dataset using Generative Neural Networks

Janez Starc

Dunja Mladenić

206

20 Jul 2016

Visual Question Answering: A Survey of Methods and Datasets

Qi Wu

Damien Teney

Peng Wang

Chunhua Shen

A. Dick

Anton Van Den Hengel

322

451

20 Jul 2016

HeMIS: Hetero-Modal Image SegmentationInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2016

661

303

18 Jul 2016

Weakly Supervised Learning of Heterogeneous Concepts in VideosEuropean Conference on Computer Vision (ECCV), 2016

195

12 Jul 2016

VideoLSTM Convolves, Attends and Flows for Action RecognitionComputer Vision and Image Understanding (CVIU), 2016

240

477

06 Jul 2016

Domain Adaptation for Neural Networks by Parameter Augmentation

158

01 Jul 2016

Dynamic Neural Turing Machine with Soft and Hard Addressing Schemes

302

30 Jun 2016

"Show me the cup": Reference with Continuous RepresentationsConference on Intelligent Text Processing and Computational Linguistics (CICLing), 2016

Gemma Boleda

Sebastian Padó

Marco Baroni

154

28 Jun 2016

Diversified Visual Attention Networks for Fine-Grained Object ClassificationIEEE transactions on multimedia (TMM), 2016

246

377

28 Jun 2016

Sequence-Level Knowledge DistillationConference on Empirical Methods in Natural Language Processing (EMNLP), 2016

Yoon Kim

Alexander M. Rush

482

1,205

25 Jun 2016

CUNI System for WMT16 Automatic Post-Editing and Multimodal Translation TasksConference on Machine Translation (WMT), 2016

151

23 Jun 2016

LSTMVis: A Tool for Visual Analysis of Hidden State Dynamics in Recurrent Neural Networks

147

23 Jun 2016

Tagger: Deep Unsupervised Perceptual Grouping

301

165

21 Jun 2016

Question Relevance in VQA: Identifying Non-Visual And False-Premise Questions

Devi Parikh

204

21 Jun 2016

Drawing and Recognizing Chinese Characters with Recurrent Neural Network

297

342

21 Jun 2016

Using Visual Analytics to Interpret Predictive Machine Learning Models

148

17 Jun 2016

FVQA: Fact-based Visual Question Answering

Peng Wang

Qi Wu

Chunhua Shen

Anton van den Hengel

A. Dick

CoGe

478

515

17 Jun 2016

Model-Agnostic Interpretability of Machine Learning

231

918

16 Jun 2016

A Correlational Encoder Decoder Architecture for Pivot Based Sequence Generation

Amrita Saha

Mitesh M. Khapra

A. Chandar

Janarthanan Rajendran

Dong Wang

147

15 Jun 2016

Unsupervised Learning of Predictors from Unpaired Input-Output Samples

Li Deng

165

15 Jun 2016

Bidirectional Long-Short Term Memory for Video Description

Zi Huang

Xing Xu

159

15 Jun 2016

Watch What You Just Said: Image Captioning with Text-Conditional Attention

202

15 Jun 2016

End-to-End Comparative Attention Networks for Person Re-identification

258

599

14 Jun 2016

Rationalizing Neural Predictions

Tao Lei

Regina Barzilay

Tommi Jaakkola

268

854

13 Jun 2016

Training Recurrent Answering Units with Joint Loss Minimization for VQA

Hyeonwoo Noh

Bohyung Han

221

12 Jun 2016

Natural Language Generation in Dialogue using Lexicalized and Delexicalized Data

234

11 Jun 2016

Human Attention in Visual Question Answering: Do Humans and Deep Networks Look at the Same Regions?

Devi Parikh

257

479

11 Jun 2016

Conditional Generation and Snapshot Learning in Neural Dialogue SystemsConference on Empirical Methods in Natural Language Processing (EMNLP), 2016

196

10 Jun 2016

Sequence-to-Sequence Learning as Beam-Search OptimizationConference on Empirical Methods in Natural Language Processing (EMNLP), 2016

Sam Wiseman

Alexander M. Rush

363

611

09 Jun 2016

Progressive Attention Networks for Visual Attribute Prediction

250

08 Jun 2016

SE3-Nets: Learning Rigid Body Motion using Deep Neural NetworksIEEE International Conference on Robotics and Automation (ICRA), 2016

Arunkumar Byravan

Dieter Fox

3DPC

424

277

08 Jun 2016

Iterative Alternating Neural Attention for Machine Reading

199

122

07 Jun 2016

Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual GroundingConference on Empirical Methods in Natural Language Processing (EMNLP), 2016

599

1,543

06 Jun 2016

Attention Correctness in Neural Image CaptioningAAAI Conference on Artificial Intelligence (AAAI), 2016

216

225

31 May 2016

End-to-End Instance Segmentation with Recurrent Attention

Mengye Ren

R. Zemel

SSeg

204

30 May 2016