MASS: Masked Sequence to Sequence Pre-training for Language Generation

7 May 2019

Xu Tan

Papers citing "MASS: Masked Sequence to Sequence Pre-training for Language Generation"

50 / 203 papers shown

Title
Examining the rhetorical capacities of neural language models Zining Zhu Chuer Pan Mohamed Abdalla Frank Rudzicz 28 10 0 01 Oct 2020
KG-BART: Knowledge Graph-Augmented BART for Generative Commonsense Reasoning Ye Liu Yao Wan Lifang He Hao Peng Philip S. Yu 21 188 0 26 Sep 2020
Harnessing Multilinguality in Unsupervised Machine Translation for Rare Languages Xavier Garcia Aditya Siddhant Orhan Firat Ankur P. Parikh 22 31 0 23 Sep 2020
Softmax Tempering for Training Neural Machine Translation Models Raj Dabre Atsushi Fujita 23 10 0 20 Sep 2020
Code-switching pre-training for neural machine translation Zhen Yang Bojie Hu Ambyera Han Shen Huang Qi Ju 19 71 0 17 Sep 2020
Reusing a Pretrained Language Model on Languages with Limited Corpora for Unsupervised NMT Alexandra Chronopoulou Dario Stojanovski Alexander Fraser 13 33 0 16 Sep 2020
Learning to summarize from human feedback Nisan Stiennon Long Ouyang Jeff Wu Daniel M. Ziegler Ryan J. Lowe Chelsea Voss Alec Radford Dario Amodei Paul Christiano ALM 19 1,978 0 02 Sep 2020
Multilingual Translation with Extensible Multilingual Pretraining and Finetuning Y. Tang C. Tran Xian Li Peng-Jen Chen Naman Goyal Vishrav Chaudhary Jiatao Gu Angela Fan CLL 47 445 0 02 Aug 2020
CoreGen: Contextualized Code Representation Learning for Commit Message Generation L. Nie Cuiyun Gao Zhicong Zhong Wai Lam Yang Liu Zenglin Xu 21 46 0 14 Jul 2020
Cross-lingual Retrieval for Iterative Self-Supervised Training C. Tran Y. Tang Xian Li Jiatao Gu RALM 28 72 0 16 Jun 2020
Unsupervised Translation of Programming Languages Marie-Anne Lachaux Baptiste Roziere L. Chanussot Guillaume Lample 34 408 0 05 Jun 2020
Funnel-Transformer: Filtering out Sequential Redundancy for Efficient Language Processing Zihang Dai Guokun Lai Yiming Yang Quoc V. Le 48 229 0 05 Jun 2020
Language Models are Few-Shot Learners Tom B. Brown Benjamin Mann Nick Ryder Melanie Subbiah Jared Kaplan ... Christopher Berner Sam McCandlish Alec Radford Ilya Sutskever Dario Amodei BDL 15 40,023 0 28 May 2020
Stronger Baselines for Grammatical Error Correction Using Pretrained Encoder-Decoder Model Satoru Katsumata Mamoru Komachi 25 53 0 24 May 2020
Unsupervised Multimodal Neural Machine Translation with Pseudo Visual Pivoting Po-Yao (Bernie) Huang Junjie Hu Xiaojun Chang Alexander G. Hauptmann 28 49 0 06 May 2020
Recipes for Adapting Pre-trained Monolingual and Multilingual Models to Machine Translation Asa Cooper Stickland Xian Li Marjan Ghazvininejad 23 44 0 30 Apr 2020
Conditional Augmentation for Aspect Term Extraction via Masked Sequence-to-Sequence Generation Kun Li Chengbo Chen Xiaojun Quan Qing Ling Yan Song 27 95 0 30 Apr 2020
Pre-training Is (Almost) All You Need: An Application to Commonsense Reasoning Alexandre Tamborrino Nicola Pellicanò B. Pannier Pascal Voitot Louise Naudin LRM 14 62 0 29 Apr 2020
QURIOUS: Question Generation Pretraining for Text Generation Shashi Narayan Gonçalo Simães Ji Ma Hannah Craighead Ryan T. McDonald 29 15 0 23 Apr 2020
When and Why is Unsupervised Neural Machine Translation Useless? Yunsu Kim Miguel Graça Hermann Ney SSL 19 70 0 22 Apr 2020
Asking and Answering Questions to Evaluate the Factual Consistency of Summaries Alex Jinpeng Wang Kyunghyun Cho M. Lewis HILM 10 470 0 08 Apr 2020
Pre-trained Models for Natural Language Processing: A Survey Xipeng Qiu Tianxiang Sun Yige Xu Yunfan Shao Ning Dai Xuanjing Huang LM&MA VLM 243 1,450 0 18 Mar 2020
A Survey on Contextual Embeddings Qi Liu Matt J. Kusner Phil Blunsom 225 146 0 16 Mar 2020
XGPT: Cross-modal Generative Pre-Training for Image Captioning Qiaolin Xia Haoyang Huang Nan Duan Dongdong Zhang Lei Ji Zhifang Sui Edward Cui Taroon Bharti Xin Liu Ming Zhou MLLM VLM 19 74 0 03 Mar 2020
Do all Roads Lead to Rome? Understanding the Role of Initialization in Iterative Back-Translation Mikel Artetxe Gorka Labaka Noe Casas Eneko Agirre LRM 11 5 0 28 Feb 2020
MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers Wenhui Wang Furu Wei Li Dong Hangbo Bao Nan Yang Ming Zhou VLM 47 1,199 0 25 Feb 2020
Generating Representative Headlines for News Stories Xiaotao Gu Yuning Mao Jiawei Han Jialu Liu Hongkun Yu You Wu Cong Yu Daniel Finnie Jiaqi Zhai Nicholas Zukoski 22 70 0 26 Jan 2020
Multilingual Denoising Pre-training for Neural Machine Translation Yinhan Liu Jiatao Gu Naman Goyal Xian Li Sergey Edunov Marjan Ghazvininejad M. Lewis Luke Zettlemoyer AI4CE AIMat 17 1,768 0 22 Jan 2020
A Study of Multilingual Neural Machine Translation Xu Tan Yichong Leng Jiale Chen Yi Ren Tao Qin Tie-Yan Liu 24 8 0 25 Dec 2019
PEGASUS: Pre-training with Extracted Gap-sentences for Abstractive Summarization Jingqing Zhang Yao-Min Zhao Mohammad Saleh Peter J. Liu RALM 3DGS 43 2,012 0 18 Dec 2019
Fine-Tuning by Curriculum Learning for Non-Autoregressive Neural Machine Translation Junliang Guo Xu Tan Linli Xu Tao Qin Enhong Chen Tie-Yan Liu 11 85 0 20 Nov 2019
Weakly-Supervised Video Moment Retrieval via Semantic Completion Network Zhijie Lin Zhou Zhao Zhu Zhang Qi. Wang Huasheng Liu 22 149 0 19 Nov 2019
Generating Persona Consistent Dialogues by Exploiting Natural Language Inference Haoyu Song Weinan Zhang Jingwen Hu Ting Liu 19 73 0 14 Nov 2019
Microsoft Research Asia's Systems for WMT19 Yingce Xia Xu Tan Fei Tian Fei Gao Weicong Chen ... Yiren Wang Lijun Wu Jinhua Zhu Tao Qin Tie-Yan Liu VLM 22 26 0 07 Nov 2019
BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension M. Lewis Yinhan Liu Naman Goyal Marjan Ghazvininejad Abdel-rahman Mohamed Omer Levy Veselin Stoyanov Luke Zettlemoyer AIMat VLM 41 10,590 0 29 Oct 2019
Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer Colin Raffel Noam M. Shazeer Adam Roberts Katherine Lee Sharan Narang Michael Matena Yanqi Zhou Wei Li Peter J. Liu AIMat 86 19,440 0 23 Oct 2019
Analyzing the Forgetting Problem in the Pretrain-Finetuning of Dialogue Response Models Tianxing He Jun Liu Kyunghyun Cho Myle Ott Bing-Quan Liu James R. Glass Fuchun Peng CLL 29 9 0 16 Oct 2019
Revisiting Self-Training for Neural Sequence Generation Junxian He Jiatao Gu Jiajun Shen MarcÁurelio Ranzato SSL LRM 244 269 0 30 Sep 2019
On the use of BERT for Neural Machine Translation S. Clinchant K. Jung Vassilina Nikoulina 19 89 0 27 Sep 2019
Cross-Lingual Natural Language Generation via Pre-Training Zewen Chi Li Dong Furu Wei Wenhui Wang Xian-Ling Mao Heyan Huang 19 136 0 23 Sep 2019
Span-based Joint Entity and Relation Extraction with Transformer Pre-training Markus Eberts A. Ulges LRM ViT 164 380 0 17 Sep 2019
Multilingual Neural Machine Translation with Language Clustering Xu Tan Jiale Chen Di He Yingce Xia Tao Qin Tie-Yan Liu 175 110 0 25 Aug 2019
Unsupervised Text Summarization via Mixed Model Back-Translation Yacine Jernite 35 2 0 22 Aug 2019
Denoising based Sequence-to-Sequence Pre-training for Text Generation Liang Wang Wei-Ye Zhao Ruoyu Jia Sujian Li Jingming Liu VLM AI4CE 34 37 0 22 Aug 2019
Encoder-Agnostic Adaptation for Conditional Language Generation Zachary M. Ziegler Luke Melas-Kyriazi Sebastian Gehrmann Alexander M. Rush AI4CE 11 57 0 19 Aug 2019
Leveraging Pre-trained Checkpoints for Sequence Generation Tasks S. Rothe Shashi Narayan Aliaksei Severyn SILM 69 433 0 29 Jul 2019
What is this Article about? Extreme Summarization with Topic-aware Convolutional Neural Networks Shashi Narayan Shay B. Cohen Mirella Lapata AILaw 29 18 0 19 Jul 2019
Future Data Helps Training: Modeling Future Contexts for Session-based Recommendation Fajie Yuan Xiangnan He Haochuan Jiang G. Guo Jian Xiong Zhezhao Xu Yilin Xiong AI4TS 13 102 0 11 Jun 2019
Unsupervised Pivot Translation for Distant Languages Yichong Leng Xu Tan Tao Qin Xiang-Yang Li Tie-Yan Liu 28 29 0 06 Jun 2019
A Generalized Framework of Sequence Generation with Application to Undirected Sequence Models Elman Mansimov Alex Jinpeng Wang Sean Welleck Kyunghyun Cho AIMat 22 46 0 29 May 2019