Convolutional Self-Attention Networks

5 April 2019

Papers citing "Convolutional Self-Attention Networks"

24 / 24 papers shown

Title
Anomaly Detection in Dynamic Graphs: A Comprehensive Survey Ocheme Anthony Ekle William Eberle AI4TS 32 10 0 31 May 2024
Efficiency-oriented approaches for self-supervised speech representation learning Luis Lugo Valentin Vielzeuf SSL 26 1 0 18 Dec 2023
SeUNet-Trans: A Simple yet Effective UNet-Transformer Model for Medical Image Segmentation Tan-Hanh Pham Xianqi Li Kim-Doang Nguyen MedIm ViT 24 8 0 16 Oct 2023
TranSFormer: Slow-Fast Transformer for Machine Translation Bei Li Yi Jing Xu Tan Zhen Xing Tong Xiao Jingbo Zhu 41 7 0 26 May 2023
EIT: Enhanced Interactive Transformer Tong Zheng Bei Li Huiwen Bao Tong Xiao Jingbo Zhu 26 2 0 20 Dec 2022
BERT-based Ensemble Approaches for Hate Speech Detection Khouloud Mnassri P. Rajapaksha R. Farahbakhsh Noel Crespi 17 18 0 14 Sep 2022
Paying More Attention to Self-attention: Improving Pre-trained Language Models via Attention Guiding Shanshan Wang Zhumin Chen Z. Ren Huasheng Liang Qiang Yan Pengjie Ren 25 9 0 06 Apr 2022
How Do Vision Transformers Work? Namuk Park Songkuk Kim ViT 32 465 0 14 Feb 2022
Language Modeling using LMUs: 10x Better Data Efficiency or Improved Scaling Compared to Transformers Narsimha Chilkuri Eric Hunsberger Aaron R. Voelker G. Malik C. Eliasmith 30 7 0 05 Oct 2021
Multi-head or Single-head? An Empirical Comparison for Transformer Training Liyuan Liu Jialu Liu Jiawei Han 21 32 0 17 Jun 2021
Attention-based Neural Beamforming Layers for Multi-channel Speech Recognition Bhargav Pulugundla Yang Gao Brian King Gokce Keskin Sri Harish Reddy Mallidi Minhua Wu J. Droppo Roland Maas 19 2 0 12 May 2021
Mask Attention Networks: Rethinking and Strengthen Transformer Zhihao Fan Yeyun Gong Dayiheng Liu Zhongyu Wei Siyuan Wang Jian Jiao Nan Duan Ruofei Zhang Xuanjing Huang 26 72 0 25 Mar 2021
Conformer: Convolution-augmented Transformer for Speech Recognition Anmol Gulati James Qin Chung-Cheng Chiu Niki Parmar Yu Zhang ... Wei Han Shibo Wang Zhengdong Zhang Yonghui Wu Ruoming Pang 48 3,027 0 16 May 2020
Abstractive Text Summarization based on Language Model Conditioning and Locality Modeling Dmitrii Aksenov J. Moreno-Schneider Peter Bourgonje Robert Schwarzenberg Leonhard Hennig Georg Rehm 19 25 0 29 Mar 2020
Fixed Encoder Self-Attention Patterns in Transformer-Based Machine Translation Alessandro Raganato Yves Scherrer Jörg Tiedemann 22 92 0 24 Feb 2020
SesameBERT: Attention for Anywhere Ta-Chun Su Hsiang-Chih Cheng 28 7 0 08 Oct 2019
On the use of BERT for Neural Machine Translation S. Clinchant K. Jung Vassilina Nikoulina 19 89 0 27 Sep 2019
Towards Better Modeling Hierarchical Structure for Self-Attention with Ordered Neurons Jie Hao Xing Wang Shuming Shi Jinfeng Zhang Zhaopeng Tu 26 12 0 04 Sep 2019
Attention Augmented Convolutional Networks Irwan Bello Barret Zoph Ashish Vaswani Jonathon Shlens Quoc V. Le 31 1,000 0 22 Apr 2019
Context-Aware Self-Attention Networks Baosong Yang Jian Li Derek F. Wong Lidia S. Chao Xing Wang Zhaopeng Tu 22 113 0 15 Feb 2019
A Decomposable Attention Model for Natural Language Inference Ankur P. Parikh Oscar Täckström Dipanjan Das Jakob Uszkoreit 201 1,367 0 06 Jun 2016
Multimodal Compact Bilinear Pooling for Visual Question Answering and Visual Grounding Akira Fukui Dong Huk Park Daylen Yang Anna Rohrbach Trevor Darrell Marcus Rohrbach 152 1,465 0 06 Jun 2016
Effective Approaches to Attention-based Neural Machine Translation Thang Luong Hieu H. Pham Christopher D. Manning 218 7,923 0 17 Aug 2015
Convolutional Neural Networks for Sentence Classification Yoon Kim AILaw VLM 255 13,364 0 25 Aug 2014