Meta-Learning Fast Weight Language Models

Conference on Empirical Methods in Natural Language Processing (EMNLP), 2022

5 December 2022

ArXiv (abs)PDF HTML Github

Papers citing "Meta-Learning Fast Weight Language Models"

12 / 12 papers shown

MesaNet: Sequence Modeling by Locally Optimal Test-Time Training

...

Blaise Agüera y Arcas

João Sacramento

406

05 Jun 2025

One-Minute Video Generation with Test-Time TrainingComputer Vision and Pattern Recognition (CVPR), 2025

...

464

07 Apr 2025

Generative Adapter: Contextualizing Language Models in Parameters with A Single Forward PassInternational Conference on Learning Representations (ICLR), 2024

393

08 Nov 2024

What is Wrong with Perplexity for Long-context Language Modeling?International Conference on Learning Representations (ICLR), 2024

800

31 Oct 2024

Learning to (Learn at Test Time): RNNs with Expressive Hidden States

...

754

241

05 Jul 2024

Online Test-Time Adaptation of Spatial-Temporal Traffic Flow Forecasting

205

08 Jan 2024

Compressed Context Memory For Online Language Model Interaction

369

06 Dec 2023

When Meta-Learning Meets Online and Continual Learning: A Survey

420

09 Nov 2023

Learning to (Learn at Test Time)

372

20 Oct 2023

Trainable Transformer in TransformerInternational Conference on Machine Learning (ICML), 2023

422

03 Jul 2023

Meta-Learning Online Adaptation of Language ModelsConference on Empirical Methods in Natural Language Processing (EMNLP), 2023

Nathan J. Hu

E. Mitchell

Christopher D. Manning

Chelsea Finn

KELM

379

24 May 2023

k

NN-Adapter: Efficient Domain Adaptation for Black-Box Language Models

Weijia Shi

257

21 Feb 2023