v1v2v3v4 (latest)

Long-term Recurrent Convolutional Networks for Visual Recognition and Description

Computer Vision and Pattern Recognition (CVPR), 2014

17 November 2014

Jeff Donahue

Lisa Anne Hendricks

Marcus Rohrbach

Subhashini Venugopalan

Papers citing "Long-term Recurrent Convolutional Networks for Visual Recognition and Description"

50 / 1,728 papers shown

Knowledge-enriched Attention Network with Group-wise Semantic for Visual StorytellingIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

244

10 Mar 2022

Live Laparoscopic Video Retrieval with Compressed Uncertainty

247

08 Mar 2022

Parallel Training of GRU Networks with a Multi-Grid Solver for Long SequencesInternational Conference on Learning Representations (ICLR), 2022

G. Moon

E. Cyr

143

07 Mar 2022

Vision-Language Intelligence: Tasks, Representation Learning, and Large Models

Lei Zhang

204

03 Mar 2022

Temporal Context Matters: Enhancing Single Image Prediction with Disease Progression RepresentationsComputer Vision and Pattern Recognition (CVPR), 2022

258

02 Mar 2022

ADVISE: ADaptive Feature Relevance and VISual Explanations for Convolutional Neural NetworksThe Visual Computer (TVC), 2022

Mohammad Mahdi Dehshibi

175

02 Mar 2022

Rethinking Pretraining as a Bridge from ANNs to SNNsIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

274

02 Mar 2022

Colar: Effective and Efficient Online Action Detection by Consulting ExemplarsComputer Vision and Pattern Recognition (CVPR), 2022

Le Yang

Junwei Han

Dingwen Zhang

326

02 Mar 2022

Skeleton Sequence and RGB Frame Based Multi-Modality Feature Fusion Network for Action Recognition

Yan Yan

Peilin Liu

242

23 Feb 2022

Exploiting long-term temporal dynamics for video captioningWorld wide web (Bussum) (WWW), 2018

Yuyu Guo

Jingqiu Zhang

Lianli Gao

131

22 Feb 2022

CaMEL: Mean Teacher Learning for Image CaptioningInternational Conference on Pattern Recognition (ICPR), 2022

Lorenzo Baraldi

194

21 Feb 2022

Shift-Memory Network for Temporal Scene Segmentation

Guo Cheng

J. Zheng

256

17 Feb 2022

When Did It Happen? Duration-informed Temporal Localization of Narrated Actions in Vlogs

217

16 Feb 2022

The influence of labeling techniques in classifying human manipulation movement of different speedInternational Conference on Pattern Recognition Applications and Methods (ICPRAM), 2022

Sadique Adnan Siddiqui

L. Gutzeit

Frank Kirchner

04 Feb 2022

Natural Language Descriptions of Deep Visual FeaturesInternational Conference on Learning Representations (ICLR), 2022

Antonio Torralba

967

148

26 Jan 2022

An Integrated Approach for Video Captioning and Applications

149

23 Jan 2022

LTC-GIF: Attracting More Clicks on Feature-length Sports Videos

Ghulam Mujtaba

Jaehyuk Choi

Eun‐Seok Ryu

103

22 Jan 2022

MeMViT: Memory-Augmented Multiscale Vision Transformer for Efficient Long-Term Video RecognitionComputer Vision and Pattern Recognition (CVPR), 2022

Christoph Feichtenhofer

ViT

479

245

20 Jan 2022

Hand-Object Interaction ReasoningAdvanced Video and Signal Based Surveillance (AVSS), 2022

Jian Ma

Dima Damen

182

13 Jan 2022

OCSampler: Compressing Videos to One Clip with Single-step SamplingComputer Vision and Pattern Recognition (CVPR), 2022

179

12 Jan 2022

Adaptive Memory Networks with Self-supervised Learning for Unsupervised Anomaly DetectionIEEE Transactions on Knowledge and Data Engineering (TKDE), 2022

186

03 Jan 2022

AdaFocus V2: End-to-End Training of Spatial Dynamic Networks for Video RecognitionComputer Vision and Pattern Recognition (CVPR), 2021

Yulin Wang

Gao Huang

231

28 Dec 2021

Synchronized Audio-Visual Frames with Fractional Positional Encoding for Transformers in Video-to-Text TranslationInternational Conference on Information Photonics (ICIP), 2021

153

28 Dec 2021

3D Skeleton-based Few-shot Action Recognition with JEANIE is not so Naïve

Lei Wang

Jun Liu

Piotr Koniusz

164

23 Dec 2021

Wholesale Electricity Price Forecasting using Integrated Long-term Recurrent Convolutional Network ModelEnergies (Energies), 2021

Vasudharini Sridharan

Mingjian Tuo

Xingpeng Li

105

23 Dec 2021

A Survey of Natural Language GenerationACM Computing Surveys (CSUR), 2021

Min Yang

336

22 Dec 2021

Driver Drowsiness Detection Using Ensemble Convolutional Neural Networks on YawDD

Zahed Siddique

122

20 Dec 2021

Adversarial Memory Networks for Action Prediction

18 Dec 2021

Calorie Aware Automatic Meal Kit Generation from an Image

Ahmad Babaeian Jelodar

Yu Sun

194

18 Dec 2021

Distillation of Human-Object Interaction Contexts for Action Recognition

Muna Almushyti

Frederick W. Li

282

17 Dec 2021

Dense Video Captioning Using Unsupervised Semantic Information

Valter Estevam

Rayson Laroca

Hélio Pedrini

David Menotti

230

15 Dec 2021

Temporal Shuffling for Defending Deep Action Recognition Models against Adversarial Attacks

Jun-Ho Choi

209

15 Dec 2021

SVIP: Sequence VerIfication for Procedures in Videos

Xu Tang

327

13 Dec 2021

Auto-X3D: Ultra-Efficient Video Understanding via Finer-Grained Neural Architecture Search

155

09 Dec 2021

^2

(GO)MOTION: Motion Augmented Event Stream for Egocentric Action Recognition

Matteo Matteucci

239

07 Dec 2021

Joint Learning of Localized Representations from Medical Images and ReportsEuropean Conference on Computer Vision (ECCV), 2021

Philipp Muller

Georgios Kaissis

Cong Zou

Daniel Munich

392

113

06 Dec 2021

D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding

Dave Zhenyu Chen

Qirui Wu

Matthias Nießner

Angel X. Chang

196

02 Dec 2021

BEVT: BERT Pretraining of Video Transformers

Zuxuan Wu

Lu Yuan

282

248

02 Dec 2021

Neural Attention for Image Captioning: Review of Outstanding Methods

Zanyar Zohourianshahzadi

Jugal Kalita

VLM

191

29 Nov 2021

ZeroCap: Zero-Shot Image-to-Text Generation for Visual-Semantic ArithmeticComputer Vision and Pattern Recognition (CVPR), 2021

Lior Wolf

327

235

29 Nov 2021

SwinBERT: End-to-End Transformers with Sparse Attention for Video CaptioningComputer Vision and Pattern Recognition (CVPR), 2021

Zicheng Liu

336

299

25 Nov 2021

Ice hockey player identification via transformers and weakly supervised learning

152

22 Nov 2021

DVCFlow: Modeling Information Flow Towards Human-like Video Captioning

Zhengcong Fei

242

19 Nov 2021

An Overview of Backdoor Attacks Against Deep Neural Networks and Possible Defences

263

16 Nov 2021

Co-segmentation Inspired Attention Module for Video-based Computer Vision TasksComputer Vision and Image Understanding (CVIU), 2021

Arulkumar Subramaniam

362

14 Nov 2021

Sparse Adversarial Video Attacks with Spatial TransformationsBritish Machine Vision Conference (BMVC), 2021

Ronghui Mu

Wenjie Ruan

Leandro Soriano Marcolino

Q. Ni

AAML

298

10 Nov 2021

D-Flow: A Real Time Spatial Temporal Model for Target Area Segmentation

Wentao Lu

Claude Sammut

148

08 Nov 2021

Evaluating deep transfer learning for whole-brain cognitive decodingJournal of the Franklin Institute (J. Franklin Inst.), 2021

134

01 Nov 2021

Multi-Task and Multi-Modal Learning for RGB Dynamic Gesture RecognitionIEEE Sensors Journal (IEEE Sens. J.), 2021

203

29 Oct 2021

Attacking Video Recognition Models with Bullet-Screen CommentsAAAI Conference on Artificial Intelligence (AAAI), 2021

Zuxuan Wu

227

29 Oct 2021