Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 8,450 papers shown

Title
Neural Rule-Execution Tracking Machine For Transformer-Based Text Generation Yufei Wang Can Xu Huang Hu Chongyang Tao Stephen Wan Mark Dras Mark Johnson Daxin Jiang 11 10 0 27 Jul 2021
Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction Lu Xu Yew Ken Chia Lidong Bing 29 179 0 26 Jul 2021
Go Wider Instead of Deeper Fuzhao Xue Ziji Shi Futao Wei Yuxuan Lou Yong Liu Yang You ViT MoE 17 80 0 25 Jul 2021
Evaluation of contextual embeddings on less-resourced languages Matej Ulvcar Alevs vZagar C. S. Armendariz Andravz Repar Senja Pollak Matthew Purver Marko Robnik-vSikonja 28 11 0 22 Jul 2021
Back-Translated Task Adaptive Pretraining: Improving Accuracy and Robustness on Text Classification Junghoon Lee Jounghee Kim Pilsung Kang VLM 11 5 0 22 Jul 2021
Spinning Sequence-to-Sequence Models with Meta-Backdoors Eugene Bagdasaryan Vitaly Shmatikov SILM AAML 35 8 0 22 Jul 2021
Memorization in Deep Neural Networks: Does the Loss Function matter? Deep Patel P. Sastry TDI 19 8 0 21 Jul 2021
The Effectiveness of Intermediate-Task Training for Code-Switched Natural Language Understanding Archiki Prasad Mohammad Ali Rehan Shreyasi Pathak P. Jyothi 19 9 0 21 Jul 2021
CausalBERT: Injecting Causal Knowledge Into Pre-trained Models with Minimal Supervision Zhongyang Li Xiao Ding Kuo Liao Bing Qin Ting Liu CML 29 17 0 21 Jul 2021
Learning De-identified Representations of Prosody from Raw Audio J. Weston R. Lenain U. Meepegama E. Fristed SSL 24 15 0 17 Jul 2021
Picard understanding Darmok: A Dataset and Model for Metaphor-Rich Translation in a Constructed Language Peter Jansen Jordan L. Boyd-Graber 11 0 0 16 Jul 2021
TAPEX: Table Pre-training via Learning a Neural SQL Executor Qian Liu Bei Chen Jiaqi Guo Morteza Ziyadi Zeqi Lin Weizhu Chen Jian-Guang Lou LMTD 10 258 0 16 Jul 2021
FewCLUE: A Chinese Few-shot Learning Evaluation Benchmark Liang Xu Xiaojing Lu Chenyang Yuan Xuanwei Zhang Huilin Xu ... Guoao Wei X. Pan Xin Tian Libo Qin Hai Hu ELM 24 56 0 15 Jul 2021
AutoBERT-Zero: Evolving BERT Backbone from Scratch Jiahui Gao Hang Xu Han Shi Xiaozhe Ren Philip L. H. Yu Xiaodan Liang Xin Jiang Zhenguo Li 19 37 0 15 Jul 2021
Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features Hannah Rashkin David Reitter Gaurav Singh Tomar Dipanjan Das 158 101 0 14 Jul 2021
DeepMutants: Training neural bug detectors with contextual mutations Cedric Richter Heike Wehrheim 19 3 0 14 Jul 2021
Learning Algebraic Recombination for Compositional Generalization Chenyao Liu Shengnan An Zeqi Lin Qian Liu Bei Chen Jian-Guang Lou Lijie Wen Nanning Zheng Dongmei Zhang CoGe 194 36 0 14 Jul 2021
Deduplicating Training Data Makes Language Models Better Katherine Lee Daphne Ippolito A. Nystrom Chiyuan Zhang Douglas Eck Chris Callison-Burch Nicholas Carlini SyDa 242 592 0 14 Jul 2021
FLAT: An Optimized Dataflow for Mitigating Attention Bottlenecks Sheng-Chun Kao Suvinay Subramanian Gaurav Agrawal Amir Yazdanbakhsh T. Krishna 32 57 0 13 Jul 2021
Combiner: Full Attention Transformer with Sparse Computation Cost Hongyu Ren H. Dai Zihang Dai Mengjiao Yang J. Leskovec Dale Schuurmans Bo Dai 76 77 0 12 Jul 2021
A Survey on Low-Resource Neural Machine Translation Rui Wang Xu Tan Renqian Luo Tao Qin Tie-Yan Liu 3DV 33 58 0 09 Jul 2021
A Survey on Dialogue Summarization: Recent Advances and New Frontiers Xiachong Feng Xiaocheng Feng Bing Qin 32 100 0 07 Jul 2021
Neural Natural Language Processing for Unstructured Data in Electronic Health Records: a Review Irene Z Li Jessica Pan Jeremy Goldwasser Neha Verma Wai Pan Wong ... Matthew Zhang David Chang R. Taylor H. Krumholz Dragomir R. Radev BDL 19 154 0 07 Jul 2021
Deep Extrapolation for Attribute-Enhanced Generation Alvin Chan Ali Madani Ben Krause Nikhil Naik 19 24 0 07 Jul 2021
PhotoChat: A Human-Human Dialogue Dataset with Photo Sharing Behavior for Joint Image-Text Modeling Xiaoxue Zang Lijuan Liu Maria Wang Yang Song Hao Zhang Jindong Chen VLM 27 55 0 06 Jul 2021
FaVIQ: FAct Verification from Information-seeking Questions Jungsoo Park Sewon Min Jaewoo Kang Luke Zettlemoyer Hannaneh Hajishirzi HILM 32 37 0 05 Jul 2021
Training Adaptive Computation for Open-Domain Question Answering with Computational Constraints Yuxiang Wu Pasquale Minervini Pontus Stenetorp Sebastian Riedel 19 5 0 05 Jul 2021
Can Transformers Jump Around Right in Natural Language? Assessing Performance Transfer from SCAN Rahma Chaabouni Roberto Dessì Eugene Kharitonov 19 20 0 03 Jul 2021
An Investigation of the (In)effectiveness of Counterfactually Augmented Data Nitish Joshi He He OODD 19 46 0 01 Jul 2021
A Primer on Pretrained Multilingual Language Models Sumanth Doddapaneni Gowtham Ramesh Mitesh M. Khapra Anoop Kunchukuttan Pratyush Kumar LRM 43 73 0 01 Jul 2021
Reinforcement Learning for Abstractive Question Summarization with Question-aware Semantic Rewards S. Yadav D. Gupta Asma Ben Abacha Dina Demner-Fushman OffRL 14 34 0 01 Jul 2021
SCARF: Self-Supervised Contrastive Learning using Random Feature Corruption Dara Bahri Heinrich Jiang Yi Tay Donald Metzler SSL 17 163 0 29 Jun 2021
Time-Aware Language Models as Temporal Knowledge Bases Bhuwan Dhingra Jeremy R. Cole Julian Martin Eisenschlos D. Gillick Jacob Eisenstein William W. Cohen KELM 28 264 0 29 Jun 2021
Overview of BioASQ 2021: The ninth BioASQ challenge on Large-Scale Biomedical Semantic Indexing and Question Answering A. Nentidis K. Bougiatiotis Carlos Rodríguez-Penagos Anastasia Krithara Marta Villegas Martin Krallinger G. Paliouras 27 45 0 28 Jun 2021
A Knowledge-Grounded Dialog System Based on Pre-Trained Language Models Weijie Zhang Jiaoxuan Chen Haipang Wu Sanhui Wan Gongfeng Li 25 4 0 28 Jun 2021
Draw Me a Flower: Processing and Grounding Abstraction in Natural Language R. Lachmy Valentina Pyatkin Avshalom Manevich Reut Tsarfaty 21 18 0 27 Jun 2021
Multimodal Few-Shot Learning with Frozen Language Models Maria Tsimpoukelli Jacob Menick Serkan Cabi S. M. Ali Eslami Oriol Vinyals Felix Hill MLLM 53 749 0 25 Jun 2021
Transflower: probabilistic autoregressive dance generation with multimodal attention Guillermo Valle Pérez G. Henter Jonas Beskow A. Holzapfel Pierre-Yves Oudeyer Simon Alexanderson 30 42 0 25 Jun 2021
XL-Sum: Large-Scale Multilingual Abstractive Summarization for 44 Languages Tahmid Hasan Abhik Bhattacharjee Md. Saiful Islam Kazi Samin Mubasshir Yuan-Fang Li Yong-Bin Kang M. Rahman Rifat Shahriyar 17 341 0 25 Jun 2021
Domain-Specific Pretraining for Vertical Search: Case Study on Biomedical Literature Yu-Chiang Frank Wang Jinchao Li Tristan Naumann Chenyan Xiong Hao Cheng ... Yang Qin Eric Horvitz Paul N. Bennett Jianfeng Gao Hoifung Poon OOD 25 13 0 25 Jun 2021
Learn to Resolve Conversational Dependency: A Consistency Training Framework for Conversational Question Answering Gangwoo Kim Hyunjae Kim Jungsoo Park Jaewoo Kang 28 38 0 22 Jun 2021
DocFormer: End-to-End Transformer for Document Understanding Srikar Appalaraju Bhavan A. Jasani Bhargava Urala Kota Yusheng Xie R. Manmatha ViT 29 270 0 22 Jun 2021
BARTScore: Evaluating Generated Text as Text Generation Weizhe Yuan Graham Neubig Pengfei Liu 11 806 0 22 Jun 2021
GAIA: A Transfer Learning System of Object Detection that Fits Your Needs Xingyuan Bu Junran Peng Junjie Yan T. Tan Zhaoxiang Zhang ObjD VLM 28 53 0 21 Jun 2021
CPM-2: Large-scale Cost-effective Pre-trained Language Models Zhengyan Zhang Yuxian Gu Xu Han Shengqi Chen Chaojun Xiao ... Minlie Huang Wentao Han Yang Liu Xiaoyan Zhu Maosong Sun MoE 26 86 0 20 Jun 2021
JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs Pei Ke Haozhe Ji Yuanyuan Ran Xin Cui Liwei Wang Linfeng Song Xiaoyan Zhu Minlie Huang 50 95 0 19 Jun 2021
Large-Scale Chemical Language Representations Capture Molecular Structure and Properties Jerret Ross Brian M. Belgodere Vijil Chenthamarakshan Inkit Padhi Youssef Mroueh Payel Das AI4CE 24 272 0 17 Jun 2021
Why Do Pretrained Language Models Help in Downstream Tasks? An Analysis of Head and Prompt Tuning Colin Wei Sang Michael Xie Tengyu Ma 24 96 0 17 Jun 2021
Can I Be of Further Assistance? Using Unstructured Knowledge Access to Improve Task-oriented Conversational Modeling Di Jin Seokhwan Kim Dilek Z. Hakkani-Tür 21 14 0 16 Jun 2021
Automatic Construction of Evaluation Suites for Natural Language Generation Datasets Simon Mille Kaustubh D. Dhole Saad Mahamood Laura Perez-Beltrachini Varun Gangal Mihir Kale Emiel van Miltenburg Sebastian Gehrmann ELM 34 22 0 16 Jun 2021