Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 8,295 papers shown

Title
FLAT: An Optimized Dataflow for Mitigating Attention Bottlenecks Sheng-Chun Kao Suvinay Subramanian Gaurav Agrawal Amir Yazdanbakhsh T. Krishna 30 57 0 13 Jul 2021
A Survey on Low-Resource Neural Machine Translation Rui Wang Xu Tan Renqian Luo Tao Qin Tie-Yan Liu 3DV 33 58 0 09 Jul 2021
A Survey on Dialogue Summarization: Recent Advances and New Frontiers Xiachong Feng Xiaocheng Feng Bing Qin 30 100 0 07 Jul 2021
Neural Natural Language Processing for Unstructured Data in Electronic Health Records: a Review Irene Z Li Jessica Pan Jeremy Goldwasser Neha Verma Wai Pan Wong ... Matthew Zhang David Chang R. Taylor H. Krumholz Dragomir R. Radev BDL 19 154 0 07 Jul 2021
Deep Extrapolation for Attribute-Enhanced Generation Alvin Chan Ali Madani Ben Krause Nikhil Naik 19 24 0 07 Jul 2021
PhotoChat: A Human-Human Dialogue Dataset with Photo Sharing Behavior for Joint Image-Text Modeling Xiaoxue Zang Lijuan Liu Maria Wang Yang Song Hao Zhang Jindong Chen VLM 21 55 0 06 Jul 2021
FaVIQ: FAct Verification from Information-seeking Questions Jungsoo Park Sewon Min Jaewoo Kang Luke Zettlemoyer Hannaneh Hajishirzi HILM 32 37 0 05 Jul 2021
Training Adaptive Computation for Open-Domain Question Answering with Computational Constraints Yuxiang Wu Pasquale Minervini Pontus Stenetorp Sebastian Riedel 19 5 0 05 Jul 2021
Can Transformers Jump Around Right in Natural Language? Assessing Performance Transfer from SCAN Rahma Chaabouni Roberto Dessì Eugene Kharitonov 19 20 0 03 Jul 2021
An Investigation of the (In)effectiveness of Counterfactually Augmented Data Nitish Joshi He He OODD 19 46 0 01 Jul 2021
A Primer on Pretrained Multilingual Language Models Sumanth Doddapaneni Gowtham Ramesh Mitesh M. Khapra Anoop Kunchukuttan Pratyush Kumar LRM 43 73 0 01 Jul 2021
Reinforcement Learning for Abstractive Question Summarization with Question-aware Semantic Rewards S. Yadav D. Gupta Asma Ben Abacha Dina Demner-Fushman OffRL 14 34 0 01 Jul 2021
SCARF: Self-Supervised Contrastive Learning using Random Feature Corruption Dara Bahri Heinrich Jiang Yi Tay Donald Metzler SSL 17 163 0 29 Jun 2021
Time-Aware Language Models as Temporal Knowledge Bases Bhuwan Dhingra Jeremy R. Cole Julian Martin Eisenschlos D. Gillick Jacob Eisenstein William W. Cohen KELM 28 264 0 29 Jun 2021
Overview of BioASQ 2021: The ninth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering A. Nentidis K. Bougiatiotis Carlos Rodríguez-Penagos Anastasia Krithara Marta Villegas Martin Krallinger G. Paliouras 27 45 0 28 Jun 2021
A Knowledge-Grounded Dialog System Based on Pre-Trained Language Models Weijie Zhang Jiaoxuan Chen Haipang Wu Sanhui Wan Gongfeng Li 20 4 0 28 Jun 2021
Draw Me a Flower: Processing and Grounding Abstraction in Natural Language R. Lachmy Valentina Pyatkin Avshalom Manevich Reut Tsarfaty 21 18 0 27 Jun 2021
Multimodal Few-Shot Learning with Frozen Language Models Maria Tsimpoukelli Jacob Menick Serkan Cabi S. M. Ali Eslami Oriol Vinyals Felix Hill MLLM 50 749 0 25 Jun 2021
Transflower: probabilistic autoregressive dance generation with multimodal attention Guillermo Valle Pérez G. Henter Jonas Beskow A. Holzapfel Pierre-Yves Oudeyer Simon Alexanderson 19 42 0 25 Jun 2021
XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages Tahmid Hasan Abhik Bhattacharjee Md. Saiful Islam Kazi Samin Mubasshir Yuan-Fang Li Yong-Bin Kang M. Rahman Rifat Shahriyar 17 341 0 25 Jun 2021
Domain-Specific Pretraining for Vertical Search: Case Study on Biomedical Literature Yu-Chiang Frank Wang Jinchao Li Tristan Naumann Chenyan Xiong Hao Cheng ... Yang Qin Eric Horvitz Paul N. Bennett Jianfeng Gao Hoifung Poon OOD 25 13 0 25 Jun 2021
Learn to Resolve Conversational Dependency: A Consistency Training Framework for Conversational Question Answering Gangwoo Kim Hyunjae Kim Jungsoo Park Jaewoo Kang 22 38 0 22 Jun 2021
DocFormer: End-to-End Transformer for Document Understanding Srikar Appalaraju Bhavan A. Jasani Bhargava Urala Kota Yusheng Xie R. Manmatha ViT 25 270 0 22 Jun 2021
BARTScore: Evaluating Generated Text as Text Generation Weizhe Yuan Graham Neubig Pengfei Liu 11 805 0 22 Jun 2021
GAIA: A Transfer Learning System of Object Detection that Fits Your Needs Xingyuan Bu Junran Peng Junjie Yan T. Tan Zhaoxiang Zhang ObjD VLM 23 53 0 21 Jun 2021
CPM-2: Large-scale Cost-effective Pre-trained Language Models Zhengyan Zhang Yuxian Gu Xu Han Shengqi Chen Chaojun Xiao ... Minlie Huang Wentao Han Yang Liu Xiaoyan Zhu Maosong Sun MoE 26 86 0 20 Jun 2021
JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs Pei Ke Haozhe Ji Yuanyuan Ran Xin Cui Liwei Wang Linfeng Song Xiaoyan Zhu Minlie Huang 48 95 0 19 Jun 2021
Large-Scale Chemical Language Representations Capture Molecular Structure and Properties Jerret Ross Brian M. Belgodere Vijil Chenthamarakshan Inkit Padhi Youssef Mroueh Payel Das AI4CE 19 272 0 17 Jun 2021
Why Do Pretrained Language Models Help in Downstream Tasks? An Analysis of Head and Prompt Tuning Colin Wei Sang Michael Xie Tengyu Ma 22 96 0 17 Jun 2021
Can I Be of Further Assistance? Using Unstructured Knowledge Access to Improve Task-oriented Conversational Modeling Di Jin Seokhwan Kim Dilek Z. Hakkani-Tür 13 14 0 16 Jun 2021
Automatic Construction of Evaluation Suites for Natural Language Generation Datasets Simon Mille Kaustubh D. Dhole Saad Mahamood Laura Perez-Beltrachini Varun Gangal Mihir Kale Emiel van Miltenburg Sebastian Gehrmann ELM 34 22 0 16 Jun 2021
Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data Haoming Jiang Danqing Zhang Tianyu Cao Bing Yin T. Zhao NoLa 19 44 0 16 Jun 2021
BEiT: BERT Pre-Training of Image Transformers Hangbo Bao Li Dong Songhao Piao Furu Wei ViT 24 2,744 0 15 Jun 2021
Evaluating Various Tokenizers for Arabic Text Classification Zaid Alyafeai Maged S. Al-Shaibani Mustafa Ghaleb Irfan Ahmad 18 41 0 14 Jun 2021
An Empirical Survey of Data Augmentation for Limited Data Learning in NLP Jiaao Chen Derek Tam Colin Raffel Mohit Bansal Diyi Yang 26 172 0 14 Jun 2021
GitTables: A Large-Scale Corpus of Relational Tables Madelon Hulsebos cCaugatay Demiralp Paul T. Groth LMTD 21 83 0 14 Jun 2021
Automatic Document Sketching: Generating Drafts from Analogous Texts Zeqiu Wu Michel Galley Chris Brockett Yizhe Zhang Bill Dolan 38 5 0 14 Jun 2021
Pre-Trained Models: Past, Present and Future Xu Han Zhengyan Zhang Ning Ding Yuxian Gu Xiao Liu ... Jie Tang Ji-Rong Wen Jinhui Yuan Wayne Xin Zhao Jun Zhu AIFin MQ AI4MH 35 813 0 14 Jun 2021
Can Transformer Language Models Predict Psychometric Properties? Antonio Laverghetta Animesh Nighojkar Jamshidbek Mirzakhalov John Licato LM&MA 30 14 0 12 Jun 2021
Prompting Contrastive Explanations for Commonsense Reasoning Tasks Bhargavi Paranjape Julian Michael Marjan Ghazvininejad Luke Zettlemoyer Hannaneh Hajishirzi ReLM LRM 20 66 0 12 Jun 2021
Improving Pretrained Cross-Lingual Language Models via Self-Labeled Word Alignment Zewen Chi Li Dong Bo Zheng Shaohan Huang Xian-Ling Mao Heyan Huang Furu Wei 45 67 0 11 Jun 2021
Generate, Annotate, and Learn: NLP with Synthetic Text Xuanli He Islam Nassar J. Kiros Gholamreza Haffari Mohammad Norouzi 31 51 0 11 Jun 2021
Space-time Mixing Attention for Video Transformer Adrian Bulat Juan-Manuel Perez-Rua Swathikiran Sudhakaran Brais Martínez Georgios Tzimiropoulos ViT 25 124 0 10 Jun 2021
Scaling Vision with Sparse Mixture of Experts C. Riquelme J. Puigcerver Basil Mustafa Maxim Neumann Rodolphe Jenatton André Susano Pinto Daniel Keysers N. Houlsby MoE 12 575 0 10 Jun 2021
Do Transformers Really Perform Bad for Graph Representation? Chengxuan Ying Tianle Cai Shengjie Luo Shuxin Zheng Guolin Ke Di He Yanming Shen Tie-Yan Liu GNN 23 433 0 09 Jun 2021
CoAtNet: Marrying Convolution and Attention for All Data Sizes Zihang Dai Hanxiao Liu Quoc V. Le Mingxing Tan ViT 49 1,167 0 09 Jun 2021
Compacter: Efficient Low-Rank Hypercomplex Adapter Layers Rabeeh Karimi Mahabadi James Henderson Sebastian Ruder MoE 33 467 0 08 Jun 2021
TIMEDIAL: Temporal Commonsense Reasoning in Dialog Lianhui Qin Aditya Gupta Shyam Upadhyay Luheng He Yejin Choi Manaal Faruqui LRM 23 65 0 08 Jun 2021
XtremeDistilTransformers: Task Transfer for Task-agnostic Distillation Subhabrata Mukherjee Ahmed Hassan Awadallah Jianfeng Gao 17 22 0 08 Jun 2021
A Survey of Transformers Tianyang Lin Yuxin Wang Xiangyang Liu Xipeng Qiu ViT 27 1,086 0 08 Jun 2021