v1v2v3 (latest)

Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data

International Conference on Learning Representations (ICLR), 2020

19 September 2020

ArXiv (abs)PDF HTML Github (56★)

Papers citing "Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data"

50 / 53 papers shown

NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective

128

21 Oct 2025

Multi-task Learning with Active Learning for Arabic Offensive Speech Detection

Aisha Alansari

Hamzah Luqman

216

03 Jun 2025

GeneralizeFormer: Layer-Adaptive Model Generation across Test-Time Distribution ShiftsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

432

15 Feb 2025

SQ-Whisper: Speaker-Querying based Whisper Model for Target-Speaker ASRIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2024

271

07 Dec 2024

USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness TaskInternational Workshop on Semantic Evaluation (SemEval), 2024

346

28 Nov 2024

Designing Domain-Specific Large Language Models: The Critical Role of Fine-Tuning in Public Opinion Simulation

Haocheng Lin

ALM

141

28 Sep 2024

GO4Align: Group Optimization for Multi-Task AlignmentNeural Information Processing Systems (NeurIPS), 2024

188

09 Apr 2024

A Cross-View Hierarchical Graph Learning Hypernetwork for Skill Demand-Supply Joint Prediction

Hengshu Zhu

Hao Liu

367

31 Jan 2024

Natural Language Processing Through Transfer Learning: A Case Study on Sentiment Analysis

Aman Yadav

A. Vichare

117

28 Nov 2023

Dynamics Generalisation in Reinforcement Learning via Adaptive Context-Aware PoliciesNeural Information Processing Systems (NeurIPS), 2023

Benjamin Rosman

288

25 Oct 2023

Interpreting and Exploiting Functional Specialization in Multi-Head Attention under Multi-task LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

212

16 Oct 2023

Denoising Task Routing for Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

531

11 Oct 2023

ScaLearn: Simple and Highly Parameter-Efficient Task Transfer by Learning to ScaleAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

342

02 Oct 2023

Challenges and Opportunities of Using Transformer-Based Multi-Task Learning in NLP Through ML Lifecycle: A Survey

216

16 Aug 2023

When Multi-Task Learning Meets Partial Supervision: A Computer Vision ReviewProceedings of the IEEE (Proc. IEEE), 2023

Maxime Fontana

Michael W. Spratling

Miaojing Shi

270

25 Jul 2023

SINC: Self-Supervised In-Context Learning for Vision-Language TasksIEEE International Conference on Computer Vision (ICCV), 2023

260

15 Jul 2023

NatLogAttack: A Framework for Attacking Natural Language Inference Models with Natural LogicAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Zióu Zheng

Xiao-Dan Zhu

AAML LRM

282

06 Jul 2023

On Conditional and Compositional Language Model Differentiable PromptingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

183

04 Jul 2023

From the One, Judge of the Whole: Typed Entailment Graph Construction with Predicate GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Zhibin Chen

Yansong Feng

Dongyan Zhao

121

07 Jun 2023

Weakly-Supervised Speech Pre-training: A Case Study on Target Speech RecognitionInterspeech (Interspeech), 2023

Wangyou Zhang

Y. Qian

242

25 May 2023

UniS-MMC: Multimodal Classification via Unimodality-supervised Multimodal Contrastive LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Heqing Zou

Meng Shen

Chen Chen

Yuchen Hu

D. Rajan

Chng Eng Siong

SSL

225

16 May 2023

Modular Deep Learning

437

103

22 Feb 2023

PrefixMol: Target- and Chemistry-aware Molecule Design via Prefix Embedding

Zhangyang Gao

Yuqi Hu

Cheng Tan

Stan Z. Li

279

14 Feb 2023

UniSumm and SummZoo: Unified Model and Diverse Benchmark for Few-Shot SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Yang Liu

Yue Zhang

320

17 Nov 2022

Adapting self-supervised models to multi-talker speech recognition using speaker embeddingsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Zili Huang

Desh Raj

Leibny Paola García-Perera

Sanjeev Khudanpur

324

01 Nov 2022

M$^3$ViT: Mixture-of-Experts Vision Transformer for Efficient Multi-task
Learning with Model-Accelerator Co-design

^3

ViT: Mixture-of-Experts Vision Transformer for Efficient Multi-task Learning with Model-Accelerator Co-designNeural Information Processing Systems (NeurIPS), 2022

247

130

26 Oct 2022

Using Graph Algorithms to Pretrain Graph Completion Transformers

192

14 Oct 2022

Modularized Transfer Learning with Multiple Knowledge Graphs for Zero-shot Commonsense ReasoningNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

Jinyoung Yeo

212

08 Jun 2022

All Birds with One Stone: Multi-task Text Classification for Efficient Inference with One Forward Pass

205

22 May 2022

Hyperdecoders: Instance-specific decoders for multi-task NLPConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Michal Guerquin

Matthew E. Peters

AI4CE

349

15 Mar 2022

Parameter-Efficient Mixture-of-Experts Architecture for Pre-trained Language ModelsInternational Conference on Computational Linguistics (COLING), 2022

279

02 Mar 2022

HyperTransformer: Model Generation for Supervised and Semi-Supervised Few-Shot LearningInternational Conference on Machine Learning (ICML), 2022

334

11 Jan 2022

VL-Adapter: Parameter-Efficient Transfer Learning for Vision-and-Language Tasks

338

433

13 Dec 2021

Analysis and Prediction of NLP Models Via Task Embeddings

Damien Sileo

Marie-Francine Moens

107

10 Dec 2021

Many Heads but One Brain: Fusion Brain -- a Competition and a Single Multimodal Multitask Architecture

...

353

22 Nov 2021

Kronecker Factorization for Preventing Catastrophic Forgetting in Large-scale Medical Entity Linking

Denis Jered McInerney

158

11 Nov 2021

BERT-DRE: BERT with Deep Recursive Encoder for Natural Language Sentence Matching

257

03 Nov 2021

Investigating the Effect of Natural Language Explanations on Out-of-Distribution Generalization in Few-shot NLIFirst Workshop on Insights from Negative Results in NLP (Insights), 2021

Yangqiaoyu Zhou

Chenhao Tan

12 Oct 2021

CoRGi: Content-Rich Graph Neural Networks with AttentionKnowledge Discovery and Data Mining (KDD), 2021

Jooyeon Kim

A. Lamb

Simon Woodhead

Simon L. Peyton Jones

Cheng Zheng

Miltiadis Allamanis

178

10 Oct 2021

Sequential Reptile: Inter-Task Gradient Alignment for Multilingual Learning

372

06 Oct 2021

BeliefBank: Adding Memory to a Pre-Trained Language Model for a Systematic Notion of Belief

Nora Kassner

Oyvind Tafjord

Hinrich Schütze

Peter Clark

KELM LRM

463

29 Sep 2021

The Trade-offs of Domain Adaptation for Neural Language Models

David Grangier

Dan Iter

178

21 Sep 2021

Multi-Task Learning in Natural Language Processing: An Overview

267

160

19 Sep 2021

Improving Scheduled Sampling with Elastic Weight Consolidation for Neural Machine Translation

Michalis Korakakis

Andreas Vlachos

CLL

200

13 Sep 2021

Are Training Resources Insufficient? Predict First Then Explain!

Myeongjun Jang

Thomas Lukasiewicz

LRM

174

29 Aug 2021

Turning Tables: Generating Examples from Semi-structured Tables for Endowing Language Models with Reasoning SkillsAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

368

15 Jul 2021

Compacter: Efficient Low-Rank Hypercomplex Adapter LayersNeural Information Processing Systems (NeurIPS), 2021

Rabeeh Karimi Mahabadi

James Henderson

Sebastian Ruder

MoE

404

582

08 Jun 2021

A Survey of TransformersAI Open (AO), 2021

Tianyang Lin

Yuxin Wang

Xiangyang Liu

Xipeng Qiu

ViT

441

1,380

08 Jun 2021

Multi-hop Graph Convolutional Network with High-order Chebyshev Approximation for Text ReasoningAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Shuoran Jiang

Qingcai Chen

Xin Liu

Baotian Hu

Lisai Zhang

111

08 Jun 2021

NLP-IIS@UT at SemEval-2021 Task 4: Machine Reading Comprehension using the Long Document TransformerInternational Workshop on Semantic Evaluation (SemEval), 2021

168

08 May 2021