MASS: Masked Sequence to Sequence Pre-training for Language Generation

7 May 2019

Xu Tan

Papers citing "MASS: Masked Sequence to Sequence Pre-training for Language Generation"

50 / 207 papers shown

Title
PARADISE: Exploiting Parallel Data for Multilingual Sequence-to-Sequence Pretraining Machel Reid Mikel Artetxe VLM 42 26 0 04 Aug 2021
Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing Pengfei Liu Weizhe Yuan Jinlan Fu Zhengbao Jiang Hiroaki Hayashi Graham Neubig VLM SyDa 31 3,831 0 28 Jul 2021
Back-Translated Task Adaptive Pretraining: Improving Accuracy and Robustness on Text Classification Junghoon Lee Jounghee Kim Pilsung Kang VLM 11 5 0 22 Jul 2021
A Survey on Low-Resource Neural Machine Translation Rui Wang Xu Tan Renqian Luo Tao Qin Tie-Yan Liu 3DV 33 58 0 09 Jul 2021
DeepRapper: Neural Rap Generation with Rhyme and Rhythm Modeling Lanqing Xue Kaitao Song Duocai Wu Xu Tan N. Zhang Tao Qin Weiqiang Zhang Tie-Yan Liu 31 37 0 05 Jul 2021
ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information Zijun Sun Xiaoya Li Xiaofei Sun Yuxian Meng Xiang Ao Qing He Fei Wu Jiwei Li SSeg 51 183 0 30 Jun 2021
The Values Encoded in Machine Learning Research Abeba Birhane Pratyusha Kalluri Dallas Card William Agnew Ravit Dotan Michelle Bao 25 274 0 29 Jun 2021
SCARF: Self-Supervised Contrastive Learning using Random Feature Corruption Dara Bahri Heinrich Jiang Yi Tay Donald Metzler SSL 19 163 0 29 Jun 2021
Neural Machine Translation for Low-Resource Languages: A Survey Surangika Ranathunga E. Lee Marjana Prifti Skenduli Ravi Shekhar Mehreen Alam Rishemjit Kaur 32 235 0 29 Jun 2021
Pre-Trained Models: Past, Present and Future Xu Han Zhengyan Zhang Ning Ding Yuxian Gu Xiao Liu ... Jie Tang Ji-Rong Wen Jinhui Yuan Wayne Xin Zhao Jun Zhu AIFin MQ AI4MH 37 815 0 14 Jun 2021
MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training Mingliang Zeng Xu Tan Rui Wang Zeqian Ju Tao Qin Tie-Yan Liu 14 127 0 10 Jun 2021
Crosslingual Embeddings are Essential in UNMT for Distant Languages: An English to IndoAryan Case Study Tamali Banerjee V. Rudra Murthy P. Bhattacharyya 27 9 0 09 Jun 2021
A Unified Generative Framework for Various NER Subtasks Hang Yan Tao Gui Junqi Dai Qipeng Guo Zheng-Wei Zhang Xipeng Qiu 22 288 0 02 Jun 2021
Should We Trust This Summary? Bayesian Abstractive Summarization to The Rescue Alexios Gidiotis Grigorios Tsoumakas UQCV UD BDL 22 9 0 21 May 2021
Contrastive Learning for Many-to-many Multilingual Neural Machine Translation Xiao Pan Mingxuan Wang Liwei Wu Lei Li 13 200 0 20 May 2021
SeaD: End-to-end Text-to-SQL Generation with Schema-aware Denoising K. Xuan Yongbo Wang Yongliang Wang Zujie Wen Yang Dong VLM 30 52 0 17 May 2021
Can You Traducir This? Machine Translation for Code-Switched Input Jitao Xu François Yvon 15 30 0 11 May 2021
FastCorrect: Fast Error Correction with Edit Alignment for Automatic Speech Recognition Yichong Leng Xu Tan Linchen Zhu Jin Xu Renqian Luo Linquan Liu Tao Qin Xiang-Yang Li Ed Lin Tie-Yan Liu KELM 24 63 0 09 May 2021
K-PLUG: Knowledge-injected Pre-trained Language Model for Natural Language Understanding and Generation in E-Commerce Song Xu Haoran Li Peng Yuan Yujia Wang Youzheng Wu Xiaodong He Ying Liu Bowen Zhou KELM 29 24 0 14 Apr 2021
A New Approach to Overgenerating and Scoring Abstractive Summaries Kaiqiang Song Bingqing Wang Z. Feng Fei Liu 14 17 0 05 Apr 2021
Inference Time Style Control for Summarization Shuyang Cao Lu Wang AI4TS 24 15 0 05 Apr 2021
Mask Attention Networks: Rethinking and Strengthen Transformer Zhihao Fan Yeyun Gong Dayiheng Liu Zhongyu Wei Siyuan Wang Jian Jiao Nan Duan Ruofei Zhang Xuanjing Huang 26 72 0 25 Mar 2021
The NLP Cookbook: Modern Recipes for Transformer based Deep Learning Architectures Sushant Singh A. Mahmood AI4TS 60 92 0 23 Mar 2021
Code-Mixing on Sesame Street: Dawn of the Adversarial Polyglots Samson Tan Shafiq R. Joty AAML 29 35 0 17 Mar 2021
Towards Continual Learning for Multilingual Machine Translation via Vocabulary Substitution Xavier Garcia Noah Constant Ankur P. Parikh Orhan Firat 40 42 0 11 Mar 2021
MalBERT: Using Transformers for Cybersecurity and Malicious Software Detection Abir Rahali M. Akhloufi 21 30 0 05 Mar 2021
Conceptual 12M: Pushing Web-Scale Image-Text Pre-Training To Recognize Long-Tail Visual Concepts Soravit Changpinyo P. Sharma Nan Ding Radu Soricut VLM 284 1,084 0 17 Feb 2021
DOBF: A Deobfuscation Pre-Training Objective for Programming Languages Baptiste Roziere Marie-Anne Lachaux Marc Szafraniec Guillaume Lample AI4CE 49 136 0 15 Feb 2021
Proof Artifact Co-training for Theorem Proving with Language Models Jesse Michael Han Jason M. Rute Yuhuai Wu Edward W. Ayers Stanislas Polu AIMat 25 120 0 11 Feb 2021
Unifying Vision-and-Language Tasks via Text Generation Jaemin Cho Jie Lei Hao Tan Joey Tianyi Zhou MLLM 256 525 0 04 Feb 2021
Outline to Story: Fine-grained Controllable Story Generation from Cascaded Events Le Fang Tao Zeng Chao-Ning Liu Liefeng Bo Wen Dong Changyou Chen 30 12 0 04 Jan 2021
Improving Sequence-to-Sequence Pre-training via Sequence Span Rewriting Wangchunshu Zhou Tao Ge Canwen Xu Ke Xu Furu Wei LRM 16 15 0 02 Jan 2021
Intent Classification and Slot Filling for Privacy Policies Wasi Uddin Ahmad Jianfeng Chi Tu Le Thomas B. Norton Yuan Tian Kai-Wei Chang 13 23 0 01 Jan 2021
MiniLMv2: Multi-Head Self-Attention Relation Distillation for Compressing Pretrained Transformers Wenhui Wang Hangbo Bao Shaohan Huang Li Dong Furu Wei MQ 19 257 0 31 Dec 2020
XLM-T: Scaling up Multilingual Machine Translation with Pretrained Cross-lingual Transformer Encoders Shuming Ma Jian Yang Haoyang Huang Zewen Chi Li Dong ... Akiko Eriguchi Saksham Singhal Xia Song Arul Menezes Furu Wei LRM 26 33 0 31 Dec 2020
Neural Machine Translation: A Review of Methods, Resources, and Tools Zhixing Tan Shuo Wang Zonghan Yang Gang Chen Xuancheng Huang Maosong Sun Yang Liu 3DV AI4TS 15 105 0 31 Dec 2020
CLEAR: Contrastive Learning for Sentence Representation Zhuofeng Wu Sinong Wang Jiatao Gu Madian Khabsa Fei Sun Hao Ma SSL 33 319 0 31 Dec 2020
ERICA: Improving Entity and Relation Understanding for Pre-trained Language Models via Contrastive Learning Yujia Qin Yankai Lin Ryuichi Takanobu Zhiyuan Liu Peng Li Heng Ji Minlie Huang Maosong Sun Jie Zhou 52 125 0 30 Dec 2020
Graph-Evolving Meta-Learning for Low-Resource Medical Dialogue Generation Shuai Lin Pan Zhou Xiaodan Liang Jianheng Tang Ruihui Zhao Ziliang Chen Liang Lin MedIm 25 53 0 22 Dec 2020
LRC-BERT: Latent-representation Contrastive Knowledge Distillation for Natural Language Understanding Hao Fu Shaojun Zhou Qihong Yang Junjie Tang Guiquan Liu Kaikui Liu Xiaolong Li 37 57 0 14 Dec 2020
Contrastive Learning with Adversarial Perturbations for Conditional Text Generation Seanie Lee Dong Bok Lee Sung Ju Hwang 15 106 0 14 Dec 2020
GLGE: A New General Language Generation Evaluation Benchmark Dayiheng Liu Yu Yan Yeyun Gong Weizhen Qi Hang Zhang ... Jiancheng Lv Ruofei Zhang Winnie Wu Ming Zhou Nan Duan ELM 40 66 0 24 Nov 2020
Multilingual AMR-to-Text Generation Angela Fan Claire Gardent 4 32 0 10 Nov 2020
Multimodal Pretraining for Dense Video Captioning Gabriel Huang Bo Pang Zhenhai Zhu Clara E. Rivera Radu Soricut 15 81 0 10 Nov 2020
Emergent Communication Pretraining for Few-Shot Machine Translation Yaoyiran Li E. Ponti Ivan Vulić Anna Korhonen 25 19 0 02 Nov 2020
The LMU Munich System for the WMT 2020 Unsupervised Machine Translation Shared Task Alexandra Chronopoulou Dario Stojanovski Viktor Hangya Alexander Fraser 37 5 0 25 Oct 2020
Unsupervised Neural Machine Translation for Low-Resource Domains via Meta-Learning Cheonbok Park Yunwon Tae Taehee Kim Soyoung Yang Mohammad Azam Khan Lucy Park Jaegul Choo 94 17 0 18 Oct 2020
Unsupervised Bitext Mining and Translation via Self-trained Contextual Embeddings Phillip Keung Julian Salazar Y. Lu Noah A. Smith SSL 25 25 0 15 Oct 2020
Plug and Play Autoencoders for Conditional Text Generation Florian Mai Nikolaos Pappas Ivan Montero Noah A. Smith U. Washington 19 36 0 06 Oct 2020
On Losses for Modern Language Models Stephane Aroca-Ouellette Frank Rudzicz 14 33 0 04 Oct 2020