v1v2v3 (latest)

Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data

International Conference on Learning Representations (ICLR), 2020

19 September 2020

ArXiv (abs)PDF HTML Github (56★)

Papers citing "Conditionally Adaptive Multi-Task Learning: Improving Transfer Learning in NLP Using Fewer Parameters & Less Data"

50 / 53 papers shown

NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective

128

21 Oct 2025

Multi-task Learning with Active Learning for Arabic Offensive Speech Detection

Aisha Alansari

Hamzah Luqman

220

03 Jun 2025

GeneralizeFormer: Layer-Adaptive Model Generation across Test-Time Distribution ShiftsIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2025

434

15 Feb 2025

SQ-Whisper: Speaker-Querying based Whisper Model for Target-Speaker ASRIEEE Transactions on Audio, Speech, and Language Processing (TASLP), 2024

283

07 Dec 2024

USTCCTSU at SemEval-2024 Task 1: Reducing Anisotropy for Cross-lingual Semantic Textual Relatedness TaskInternational Workshop on Semantic Evaluation (SemEval), 2024

346

28 Nov 2024

Designing Domain-Specific Large Language Models: The Critical Role of Fine-Tuning in Public Opinion Simulation

Haocheng Lin

ALM

150

28 Sep 2024

GO4Align: Group Optimization for Multi-Task AlignmentNeural Information Processing Systems (NeurIPS), 2024

191

09 Apr 2024

A Cross-View Hierarchical Graph Learning Hypernetwork for Skill Demand-Supply Joint Prediction

Hengshu Zhu

Hao Liu

376

31 Jan 2024

Natural Language Processing Through Transfer Learning: A Case Study on Sentiment Analysis

Aman Yadav

A. Vichare

117

28 Nov 2023

Dynamics Generalisation in Reinforcement Learning via Adaptive Context-Aware PoliciesNeural Information Processing Systems (NeurIPS), 2023

Benjamin Rosman

291

25 Oct 2023

Interpreting and Exploiting Functional Specialization in Multi-Head Attention under Multi-task LearningConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

222

16 Oct 2023

Denoising Task Routing for Diffusion ModelsInternational Conference on Learning Representations (ICLR), 2023

535

11 Oct 2023

ScaLearn: Simple and Highly Parameter-Efficient Task Transfer by Learning to ScaleAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

348

02 Oct 2023

Challenges and Opportunities of Using Transformer-Based Multi-Task Learning in NLP Through ML Lifecycle: A Survey

216

16 Aug 2023

When Multi-Task Learning Meets Partial Supervision: A Computer Vision ReviewProceedings of the IEEE (Proc. IEEE), 2023

Maxime Fontana

Michael W. Spratling

Miaojing Shi

272

25 Jul 2023

SINC: Self-Supervised In-Context Learning for Vision-Language TasksIEEE International Conference on Computer Vision (ICCV), 2023

261

15 Jul 2023

NatLogAttack: A Framework for Attacking Natural Language Inference Models with Natural LogicAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Zióu Zheng

Xiao-Dan Zhu

AAML LRM

282

06 Jul 2023

On Conditional and Compositional Language Model Differentiable PromptingInternational Joint Conference on Artificial Intelligence (IJCAI), 2023

185

04 Jul 2023

From the One, Judge of the Whole: Typed Entailment Graph Construction with Predicate GenerationAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Zhibin Chen

Yansong Feng

Dongyan Zhao

128

07 Jun 2023

Weakly-Supervised Speech Pre-training: A Case Study on Target Speech RecognitionInterspeech (Interspeech), 2023

Wangyou Zhang

Y. Qian

246

25 May 2023

UniS-MMC: Multimodal Classification via Unimodality-supervised Multimodal Contrastive LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2023

Heqing Zou

Meng Shen

Chen Chen

Yuchen Hu

D. Rajan

Chng Eng Siong

SSL

225

16 May 2023

Modular Deep Learning

438

103

22 Feb 2023

PrefixMol: Target- and Chemistry-aware Molecule Design via Prefix Embedding

Zhangyang Gao

Yuqi Hu

Cheng Tan

Stan Z. Li

280

14 Feb 2023

UniSumm and SummZoo: Unified Model and Diverse Benchmark for Few-Shot SummarizationAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Yang Liu

Yue Zhang

329

17 Nov 2022

Adapting self-supervised models to multi-talker speech recognition using speaker embeddingsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Zili Huang

Desh Raj

Leibny Paola García-Perera

Sanjeev Khudanpur

327

01 Nov 2022

M$^3$ViT: Mixture-of-Experts Vision Transformer for Efficient Multi-task
Learning with Model-Accelerator Co-design

^3

ViT: Mixture-of-Experts Vision Transformer for Efficient Multi-task Learning with Model-Accelerator Co-designNeural Information Processing Systems (NeurIPS), 2022

257

131

26 Oct 2022

Using Graph Algorithms to Pretrain Graph Completion Transformers

196

14 Oct 2022

Modularized Transfer Learning with Multiple Knowledge Graphs for Zero-shot Commonsense ReasoningNorth American Chapter of the Association for Computational Linguistics (NAACL), 2022

Jinyoung Yeo

215

08 Jun 2022

All Birds with One Stone: Multi-task Text Classification for Efficient Inference with One Forward Pass

217

22 May 2022

Hyperdecoders: Instance-specific decoders for multi-task NLPConference on Empirical Methods in Natural Language Processing (EMNLP), 2022

Michal Guerquin

Matthew E. Peters

AI4CE

356

15 Mar 2022

Parameter-Efficient Mixture-of-Experts Architecture for Pre-trained Language ModelsInternational Conference on Computational Linguistics (COLING), 2022

296

02 Mar 2022

HyperTransformer: Model Generation for Supervised and Semi-Supervised Few-Shot LearningInternational Conference on Machine Learning (ICML), 2022

352

11 Jan 2022

VL-Adapter: Parameter-Efficient Transfer Learning for Vision-and-Language Tasks

353

435

13 Dec 2021

Analysis and Prediction of NLP Models Via Task Embeddings

Damien Sileo

Marie-Francine Moens

114

10 Dec 2021

Many Heads but One Brain: Fusion Brain -- a Competition and a Single Multimodal Multitask Architecture

...

362

22 Nov 2021

Kronecker Factorization for Preventing Catastrophic Forgetting in Large-scale Medical Entity Linking

Denis Jered McInerney

160

11 Nov 2021

BERT-DRE: BERT with Deep Recursive Encoder for Natural Language Sentence Matching

276

03 Nov 2021

Investigating the Effect of Natural Language Explanations on Out-of-Distribution Generalization in Few-shot NLIFirst Workshop on Insights from Negative Results in NLP (Insights), 2021

Yangqiaoyu Zhou

Chenhao Tan

12 Oct 2021

CoRGi: Content-Rich Graph Neural Networks with AttentionKnowledge Discovery and Data Mining (KDD), 2021

Jooyeon Kim

A. Lamb

Simon Woodhead

Simon L. Peyton Jones

Cheng Zheng

Miltiadis Allamanis

193

10 Oct 2021

Sequential Reptile: Inter-Task Gradient Alignment for Multilingual Learning

387

06 Oct 2021

BeliefBank: Adding Memory to a Pre-Trained Language Model for a Systematic Notion of Belief

Nora Kassner

Oyvind Tafjord

Hinrich Schütze

Peter Clark

KELM LRM

464

29 Sep 2021

The Trade-offs of Domain Adaptation for Neural Language Models

David Grangier

Dan Iter

180

21 Sep 2021

Multi-Task Learning in Natural Language Processing: An Overview

272

162

19 Sep 2021

Improving Scheduled Sampling with Elastic Weight Consolidation for Neural Machine Translation

Michalis Korakakis

Andreas Vlachos

CLL

207

13 Sep 2021

Are Training Resources Insufficient? Predict First Then Explain!

Myeongjun Jang

Thomas Lukasiewicz

LRM

177

29 Aug 2021

Turning Tables: Generating Examples from Semi-structured Tables for Endowing Language Models with Reasoning SkillsAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

370

15 Jul 2021

Compacter: Efficient Low-Rank Hypercomplex Adapter LayersNeural Information Processing Systems (NeurIPS), 2021

Rabeeh Karimi Mahabadi

James Henderson

Sebastian Ruder

MoE

408

584

08 Jun 2021

A Survey of TransformersAI Open (AO), 2021

Tianyang Lin

Yuxin Wang

Xiangyang Liu

Xipeng Qiu

ViT

447

1,386

08 Jun 2021

Multi-hop Graph Convolutional Network with High-order Chebyshev Approximation for Text ReasoningAnnual Meeting of the Association for Computational Linguistics (ACL), 2021

Shuoran Jiang

Qingcai Chen

Xin Liu

Baotian Hu

Lisai Zhang

114

08 Jun 2021

NLP-IIS@UT at SemEval-2021 Task 4: Machine Reading Comprehension using the Long Document TransformerInternational Workshop on Semantic Evaluation (SemEval), 2021

169

08 May 2021