Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

23 October 2019

Sharan Narang

Papers citing "Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"

50 / 8,404 papers shown

Title
ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive Summarization with Argument Mining Alexander R. Fabbri Faiaz Rahman Imad Rizvi Borui Wang Haoran Li Yashar Mehdad Dragomir R. Radev 25 60 0 01 Jun 2021
CIDER: Commonsense Inference for Dialogue Explanation and Reasoning Deepanway Ghosal Pengfei Hong Siqi Shen Navonil Majumder Rada Mihalcea Soujanya Poria 53 22 0 01 Jun 2021
PIGLeT: Language Grounding Through Neuro-Symbolic Interaction in a 3D World Rowan Zellers Ari Holtzman Matthew E. Peters Roozbeh Mottaghi Aniruddha Kembhavi Ali Farhadi Yejin Choi 19 68 0 01 Jun 2021
On Compositional Generalization of Neural Machine Translation Yafu Li Yongjing Yin Yulong Chen Yue Zhang 153 44 0 31 May 2021
Towards mental time travel: a hierarchical memory for reinforcement learning agents Andrew Kyle Lampinen Stephanie C. Y. Chan Andrea Banino Felix Hill 24 47 0 28 May 2021
LMMS Reloaded: Transformer-based Sense Embeddings for Disambiguation and Beyond Daniel Loureiro A. Jorge Jose Camacho-Collados 33 26 0 26 May 2021
Dynamic Semantic Graph Construction and Reasoning for Explainable Multi-hop Science Question Answering Weiwen Xu Huihui Zhang Deng Cai Wai Lam 26 34 0 25 May 2021
PTR: Prompt Tuning with Rules for Text Classification Xu Han Weilin Zhao Ning Ding Zhiyuan Liu Maosong Sun VLM 35 513 0 24 May 2021
DeepDebug: Fixing Python Bugs Using Stack Traces, Backtranslation, and Code Skeletons Dawn Drain Colin B. Clement Guillermo Serrato Neel Sundaresan 17 31 0 19 May 2021
Relative Positional Encoding for Transformers with Linear Complexity Antoine Liutkus Ondřej Cífka Shih-Lun Wu Umut Simsekli Yi-Hsuan Yang Gaël Richard 25 44 0 18 May 2021
BookSum: A Collection of Datasets for Long-form Narrative Summarization Wojciech Kry'sciñski Nazneen Rajani Divyansh Agarwal Caiming Xiong Dragomir R. Radev RALM 19 145 0 18 May 2021
Pay Attention to MLPs Hanxiao Liu Zihang Dai David R. So Quoc V. Le AI4CE 39 651 0 17 May 2021
SeaD: End-to-end Text-to-SQL Generation with Schema-aware Denoising K. Xuan Yongbo Wang Yongliang Wang Zujie Wen Yang Dong VLM 25 52 0 17 May 2021
Doc2Dict: Information Extraction as Text Generation Benjamin Townsend Eamon Ito-Fisher Lily Zhang Madison May 28 7 0 16 May 2021
A cost-benefit analysis of cross-lingual transfer methods G. Rosa L. Bonifacio Leandro Rodrigues de Souza R. Lotufo Rodrigo Nogueira 19 12 0 14 May 2021
Out-of-Manifold Regularization in Contextual Embedding Space for Text Classification Seonghyeon Lee Dongha Lee Hwanjo Yu 19 4 0 14 May 2021
RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling Yizhe Zhang Siqi Sun Xiang Gao Yuwei Fang Chris Brockett Michel Galley Jianfeng Gao Bill Dolan RALM 30 30 0 14 May 2021
How Reliable are Model Diagnostics? V. Aribandi Yi Tay Donald Metzler 19 19 0 12 May 2021
Addressing "Documentation Debt" in Machine Learning Research: A Retrospective Datasheet for BookCorpus Jack Bandy Nicholas Vincent 19 57 0 11 May 2021
T-EMDE: Sketching-based global similarity for cross-modal retrieval Barbara Rychalska Mikolaj Wieczorek Jacek Dąbrowski 25 0 0 10 May 2021
MS MARCO: Benchmarking Ranking Models in the Large-Data Regime Nick Craswell Bhaskar Mitra Emine Yilmaz Daniel Fernando Campos Jimmy J. Lin ALM 38 63 0 09 May 2021
Which transformer architecture fits my data? A vocabulary bottleneck in self-attention Noam Wies Yoav Levine Daniel Jannai Amnon Shashua 40 20 0 09 May 2021
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents Chaojun Xiao Xueyu Hu Zhiyuan Liu Cunchao Tu Maosong Sun AILaw ELM 37 229 0 09 May 2021
Empirical Evaluation of Pre-trained Transformers for Human-Level NLP: The Role of Sample Size and Dimensionality Adithya V Ganesan Matthew Matero Aravind Reddy Ravula Huy-Hien Vu H. A. Schwartz 20 35 0 07 May 2021
A Dataset of Information-Seeking Questions and Answers Anchored in Research Papers Pradeep Dasigi Kyle Lo Iz Beltagy Arman Cohan Noah A. Smith Matt Gardner RALM 31 277 0 07 May 2021
A Novel Estimator of Mutual Information for Learning to Disentangle Textual Representations Pierre Colombo Chloé Clavel Pablo Piantanida AAML DRL 26 50 0 06 May 2021
Rethinking Search: Making Domain Experts out of Dilettantes Donald Metzler Yi Tay Dara Bahri Marc Najork LRM 30 46 0 05 May 2021
HerBERT: Efficiently Pretrained Transformer-based Language Model for Polish Robert Mroczkowski Piotr Rybak Alina Wróblewska Ireneusz Gawlik 28 81 0 04 May 2021
Evaluating Attribution in Dialogue Systems: The BEGIN Benchmark Nouha Dziri Hannah Rashkin Tal Linzen David Reitter ALM 187 79 0 30 Apr 2021
Entailment as Few-Shot Learner Sinong Wang Han Fang Madian Khabsa Hanzi Mao Hao Ma 30 183 0 29 Apr 2021
A First Look: Towards Explainable TextVQA Models via Visual and Textual Explanations Varun Nagaraj Rao Xingjian Zhen K. Hovsepian Mingwei Shen 29 17 0 29 Apr 2021
MineGAN++: Mining Generative Models for Efficient Knowledge Transfer to Limited Data Domains Yaxing Wang Abel Gonzalez-Garcia Chenshen Wu Luis Herranz F. Khan Shangling Jui Joost van de Weijer 24 6 0 28 Apr 2021
What Makes a Message Persuasive? Identifying Adaptations Towards Persuasiveness in Nine Exploratory Case Studies Sebastian Duerr Krystian Teodor Lange P. Gloor 13 2 0 26 Apr 2021
PanGu- $α$ : Large-scale Autoregressive Pretrained Chinese Language Models with Auto-parallel Computation Wei Zeng Xiaozhe Ren Teng Su Hui Wang Yi-Lun Liao ... Gaojun Fan Yaowei Wang Xuefeng Jin Qun Liu Yonghong Tian ALM MoE AI4CE 27 212 0 26 Apr 2021
A Survey of Modern Deep Learning based Object Detection Models Syed Sahil Abbas Zaidi M. S. Ansari Asra Aslam N. Kanwal M. Asghar Brian Lee VLM ObjD 67 728 0 24 Apr 2021
Generating abstractive summaries of Lithuanian news articles using a transformer model Lukas Stankevicius M. Lukoševičius 16 2 0 23 Apr 2021
Provable Limitations of Acquiring Meaning from Ungrounded Form: What Will Future Language Models Understand? William Merrill Yoav Goldberg Roy Schwartz Noah A. Smith 17 67 0 22 Apr 2021
Efficient Retrieval Optimized Multi-task Learning He Fun S. Gandhi Sujith Ravi RALM 18 6 0 20 Apr 2021
RoFormer: Enhanced Transformer with Rotary Position Embedding Jianlin Su Yu Lu Shengfeng Pan Ahmed Murtadha Bo Wen Yunfeng Liu 38 2,168 0 20 Apr 2021
Understanding Chinese Video and Language via Contrastive Multimodal Pre-Training Chenyi Lei Shixian Luo Yong-jin Liu Wanggui He Jiamang Wang Guoxin Wang Haihong Tang C. Miao Houqiang Li 28 41 0 19 Apr 2021
Latent-Optimized Adversarial Neural Transfer for Sarcasm Detection Xu Guo Boyang Albert Li Han Yu C. Miao AAML 17 17 0 19 Apr 2021
CrossFit: A Few-shot Learning Challenge for Cross-task Generalization in NLP Qinyuan Ye Bill Yuchen Lin Xiang Ren 211 179 0 18 Apr 2021
Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Prompt Order Sensitivity Yao Lu Max Bartolo Alastair Moore Sebastian Riedel Pontus Stenetorp AILaw LRM 279 1,121 0 18 Apr 2021
BEIR: A Heterogenous Benchmark for Zero-shot Evaluation of Information Retrieval Models Nandan Thakur Nils Reimers Andreas Rucklé Abhishek Srivastava Iryna Gurevych VLM 231 966 0 17 Apr 2021
TransVG: End-to-End Visual Grounding with Transformers Jiajun Deng Zhengyuan Yang Tianlang Chen Wen-gang Zhou Houqiang Li ViT 21 329 0 17 Apr 2021
Joint Passage Ranking for Diverse Multi-Answer Retrieval Sewon Min Kenton Lee Ming-Wei Chang Kristina Toutanova Hannaneh Hajishirzi 16 39 0 17 Apr 2021
AMMU : A Survey of Transformer-based Biomedical Pretrained Language Models Katikapalli Subramanyam Kalyan A. Rajasekharan S. Sangeetha LM&MA MedIm 20 164 0 16 Apr 2021
Learning to Reason for Text Generation from Scientific Tables N. Moosavi Andreas Rucklé Dan Roth Iryna Gurevych LMTD LRM 16 20 0 16 Apr 2021
Editing Factual Knowledge in Language Models Nicola De Cao Wilker Aziz Ivan Titov KELM 45 473 0 16 Apr 2021
Back to Square One: Artifact Detection, Training and Commonsense Disentanglement in the Winograd Schema Yanai Elazar Hongming Zhang Yoav Goldberg Dan Roth ReLM LRM 37 44 0 16 Apr 2021