v1v2 (latest)

SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning

17 November 2016

Wei Liu

Papers citing "SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning"

50 / 440 papers shown

Learning Personalized Page Content Ranking Using Customer Representation

164

09 May 2023

From Association to Generation: Text-only Captioning by Unsupervised Cross-modal MappingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

294

26 Apr 2023

Co-attention Propagation Network for Zero-Shot Video Object SegmentationIEEE Transactions on Image Processing (IEEE TIP), 2023

278

08 Apr 2023

SARGAN: Spatial Attention-based Residuals for Facial Expression Manipulation

Arbish Akram

Nazar Khan

GAN CVBM

209

30 Mar 2023

Multi-scale Hierarchical Vision Transformer with Cascaded Attention Decoding for Medical Image SegmentationInternational Conference on Medical Imaging with Deep Learning (MIDL), 2023

Md Mostafijur Rahman

R. Marculescu

MedIm ViT

194

29 Mar 2023

SiamTHN: Siamese Target Highlight Network for Visual Tracking

Xian Sun

145

22 Mar 2023

Learning Combinatorial Prompts for Universal Controllable Image CaptioningInternational Journal of Computer Vision (IJCV), 2023

Zhen Wang

Jun Xiao

Yueting Zhuang

Fei Gao

Jian Shao

Long Chen

198

11 Mar 2023

Distilled Reverse Attention Network for Open-world Compositional Zero-Shot LearningIEEE International Conference on Computer Vision (ICCV), 2023

201

01 Mar 2023

GRAN: Ghost Residual Attention Network for Single Image Super Resolution

Qingsen Yan

167

28 Feb 2023

Pixel Difference Convolutional Network for RGB-D Semantic Segmentation

232

23 Feb 2023

Stacked Cross-modal Feature Consolidation Attention Networks for Image Captioning

Mozhgan Pourkeshavarz

Shahabedin Nabavi

Mohsen Moghaddam

M. Shamsfard

189

08 Feb 2023

Multimodality Representation Learning: A Survey on Evolution, Pretraining and Its Applications

Muhammad Arslan Manzoor

330

01 Feb 2023

From English to More Languages: Parameter-Efficient Model Reprogramming for Cross-Lingual Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

178

19 Jan 2023

Collaborative Perception in Autonomous Driving: Methods, Datasets and ChallengesIEEE Intelligent Transportation Systems Magazine (ITS), 2023

314

191

16 Jan 2023

Noise-aware Learning from Web-crawled Image-Text Data for Image CaptioningIEEE International Conference on Computer Vision (ICCV), 2022

245

27 Dec 2022

CAT: Learning to Collaborate Channel and Spatial Attention from Multi-Information FusionIET Computer Vision (ICV), 2022

198

13 Dec 2022

Semiconductor Defect Pattern Classification by Self-Proliferation-and-Attention Neural NetworkIEEE transactions on semiconductor manufacturing (IEEE TSM), 2022

Yuanfu Yang

Min Sun

162

01 Dec 2022

ExpNet: A unified network for Expert-Level Classification

Haoyi Xiong

Yanwu Xu

228

29 Nov 2022

Conditioning Covert Geo-Location (CGL) Detection on Semantic Class InformationPattern Recognition and Machine Intelligence (PRMI), 2022

Binoy Saha

Sukhendu Das

179

27 Nov 2022

A Novel Center-based Deep Contrastive Metric Learning Method for the Detection of Polymicrogyria in Pediatric Brain MRI

Lingfeng Zhang

N. Abdeen

Jochen Lang

129

22 Nov 2022

AdaTriplet-RA: Domain Matching via Adaptive Triplet and Reinforced Attention for Unsupervised Domain AdaptationSignal processing. Image communication (SPIC), 2022

Yuan Xie

213

16 Nov 2022

PKCAM: Previous Knowledge Channel Attention Module

Eslam Mohamed Bakr

Ahmad El-Sallab

M. Rashwan

116

14 Nov 2022

OSIC: A New One-Stage Image Captioner CoinedInternational Joint Conference on Artificial Intelligence (IJCAI), 2022

Meng Wang

218

04 Nov 2022

Text-Only Training for Image Captioning using Noise-Injected CLIPConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

299

124

01 Nov 2022

Handwashing Action Detection System for an Autonomous Social RobotIEEE Region 10 Conference (TENCON), 2022

27 Oct 2022

Towards Improving Workers' Safety and Progress Monitoring of Construction Sites Through Construction Site Understanding

Mahdi Bonyani

Maryam Soleymani

132

27 Oct 2022

Prophet Attention: Predicting Attention with Future Attention for Image CaptioningNeural Information Processing Systems (NeurIPS), 2022

Xuancheng Ren

Yuexian Zou

231

19 Oct 2022

Hierarchical and Progressive Image Matting

Yu Qiao

Guofeng Zhang

160

13 Oct 2022

DCANet: Differential Convolution Attention Network for RGB-D Semantic SegmentationPattern Recognition (Pattern Recogn.), 2022

187

13 Oct 2022

CIR-Net: Cross-modality Interaction and Refinement for RGB-D Salient Object DetectionIEEE Transactions on Image Processing (IEEE TIP), 2022

Runmin Cong

186

167

06 Oct 2022

Vision+X: A Survey on Multimodal Learning in the Light of DataIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Ye Zhu

Yuehua Wu

Andrii Zadaianchuk

Yan Yan

354

05 Oct 2022

Learning to Collocate Visual-Linguistic Neural Modules for Image CaptioningInternational Journal of Computer Vision (IJCV), 2022

Jianfei Cai

273

04 Oct 2022

SEMICON: A Learning-to-hash Solution for Large-scale Fine-grained Image RetrievalEuropean Conference on Computer Vision (ECCV), 2022

Jian Yang

267

28 Sep 2022

A Spatial-channel-temporal-fused Attention for Spiking Neural NetworksIEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022

292

22 Sep 2022

Scale Attention for Learning Deep Face Representation: A Study Against Visual Scale Variation

Yibo Hu

202

19 Sep 2022

SegNeXt: Rethinking Convolutional Attention Design for Semantic SegmentationNeural Information Processing Systems (NeurIPS), 2022

Ming-Ming Cheng

321

989

18 Sep 2022

MIPI 2022 Challenge on Under-Display Camera Image Restoration: Methods and Results

217

15 Sep 2022

Booster-SHOT: Boosting Stacked Homography Transformations for Multiview Pedestrian Detection with AttentionIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2022

133

19 Aug 2022

GSRFormer: Grounded Situation Recognition Transformer with Alternate Semantic Attention RefinementACM Multimedia (ACM MM), 2022

Alexander G. Hauptmann

277

18 Aug 2022

Aesthetic Attributes Assessment of Images with AMANv2 and DPC-CaptionsV2

115

09 Aug 2022

Integrating Object-aware and Interaction-aware Knowledge for Weakly Supervised Scene Graph GenerationACM Multimedia (ACM MM), 2022

Yi Yang

196

03 Aug 2022

NICEST: Noisy Label Correction and Training for Robust Scene Graph GenerationIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Lin Li

Jun Xiao

Hanrong Shi

Hanwang Zhang

Yi Yang

Wen Liu

Long Chen

205

27 Jul 2022

Rethinking the Reference-based Distinctive Image CaptioningACM Multimedia (ACM MM), 2022

225

22 Jul 2022

Correspondence Matters for Video Referring Expression ComprehensionACM Multimedia (ACM MM), 2022

308

21 Jul 2022

Explicit Image Caption EditingEuropean Conference on Computer Vision (ECCV), 2022

179

20 Jul 2022

Dynamic Prototype Mask for Occluded Person Re-IdentificationACM Multimedia (ACM MM), 2022

Lei Tan

Pingyang Dai

Rongrong Ji

Yongjian Wu

151

19 Jul 2022

Rethinking Data Augmentation for Robust Visual Question AnsweringEuropean Conference on Computer Vision (ECCV), 2022

197

18 Jul 2022

Continuous Facial Motion DeblurringIEEE Access (IEEE Access), 2022

Tae Bok Lee

Sujy Han

Y. S. Heo

231

14 Jul 2022

Are metrics measuring what they should? An evaluation of image captioning task metricsSignal processing. Image communication (SPIC), 2022

Othón González-Chávez

Guillermo Ruiz

Daniela Moctezuma

Tania A. Ramirez-delreal

219

04 Jul 2022

Trichomonas Vaginalis Segmentation in Microscope ImagesInternational Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI), 2022

141

03 Jul 2022