v1v2 (latest)

Pretrained Transformers as Universal Computation Engines

9 March 2021

Kevin Lu

Aditya Grover

Pieter Abbeel

Igor Mordatch

ArXiv (abs)PDF HTML HuggingFace (1 upvotes)

Papers citing "Pretrained Transformers as Universal Computation Engines"

50 / 151 papers shown

Selection-Inference: Exploiting Large Language Models for Interpretable Logical ReasoningInternational Conference on Learning Representations (ICLR), 2022

418

451

19 May 2022

Clinical Prompt Learning with Frozen Language Models

189

11 May 2022

StorSeismic: A new paradigm in deep learning for seismic processingIEEE Transactions on Geoscience and Remote Sensing (IEEE TGRS), 2022

R. Harsuko

T. Alkhalifah

173

30 Apr 2022

Efficient Architecture Search for Diverse TasksNeural Information Processing Systems (NeurIPS), 2022

Jun Shen

M. Khodak

Ameet Talwalkar

372

15 Apr 2022

Causal Transformer for Estimating Counterfactual OutcomesInternational Conference on Machine Learning (ICML), 2022

296

137

14 Apr 2022

Single-Stream Multi-Level Alignment for Vision-Language PretrainingEuropean Conference on Computer Vision (ECCV), 2022

399

27 Mar 2022

Linking Emergent and Natural Languages via Corpus TransferInternational Conference on Learning Representations (ICLR), 2022

Chuang Gan

343

24 Mar 2022

Hyperbolic Vision Transformers: Combining Improvements in Metric LearningComputer Vision and Pattern Recognition (CVPR), 2022

347

157

21 Mar 2022

Pretraining with Artificial Language: Studying Transferable Knowledge in Language ModelsAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Ryokan Ri

Yoshimasa Tsuruoka

285

19 Mar 2022

Summarizing a virtual robot's past actions in natural language

Chad DeChant

Daniel Bauer

LM&Ro

210

13 Mar 2022

DUAL: Discrete Spoken Unit Adaptive Learning for Textless Spoken Question AnsweringInterspeech (Interspeech), 2022

Guan-Ting Lin

392

09 Mar 2022

High-Modality Multimodal Transformer: Quantifying Modality & Interaction Heterogeneity for High-Modality Representation Learning

Shentong Mo

Louis-Philippe Morency

Ruslan Salakhutdinov

291

02 Mar 2022

Model Reprogramming: Resource-Efficient Cross-Domain Machine LearningAAAI Conference on Artificial Intelligence (AAAI), 2022

Pin-Yu Chen

VLM

565

22 Feb 2022

MineRL Diamond 2021 Competition: Overview, Results, and Lessons LearnedNeural Information Processing Systems (NeurIPS), 2022

...

315

17 Feb 2022

Online Decision TransformerInternational Conference on Machine Learning (ICML), 2022

403

250

11 Feb 2022

TTS-GAN: A Transformer-based Time-Series Generative Adversarial NetworkConference on Artificial Intelligence in Medicine in Europe (AIME), 2022

236

150

06 Feb 2022

Pre-Trained Language Models for Interactive Decision-MakingNeural Information Processing Systems (NeurIPS), 2022

Shuang Li

...

Antonio Torralba

482

317

03 Feb 2022

Regression Transformer: Concurrent sequence regression and generation for molecular language modelingNature Machine Intelligence (Nat. Mach. Intell.), 2022

Jannis Born

Matteo Manica

315

135

01 Feb 2022

Can Wikipedia Help Offline Reinforcement Learning?

726

103

28 Jan 2022

Pre-Trained Language Transformers are Universal Image Classifiers

174

25 Jan 2022

Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied AgentsInternational Conference on Machine Learning (ICML), 2022

Wenlong Huang

Pieter Abbeel

Deepak Pathak

Igor Mordatch

LM&Ro

402

1,480

18 Jan 2022

Video Transformers: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

550

152

16 Jan 2022

CLIP-TD: CLIP Targeted Distillation for Vision-Language Tasks

Jianwei Yang

Lu Yuan

277

15 Jan 2022

Improved Input Reprogramming for GAN Conditioning

Liang Shang

313

07 Jan 2022

Discrete and continuous representations and processing in deep learning: Looking forwardAI Open (AO), 2022

328

04 Jan 2022

FLAVA: A Foundational Language And Vision Alignment Model

Amanpreet Singh

Douwe Kiela

489

912

08 Dec 2021

Emojich -- zero-shot emoji generation using Russian language: a technical report

245

04 Dec 2021

Show Your Work: Scratchpads for Intermediate Computation with Language Models

Henryk Michalewski

...

681

976

30 Nov 2021

Many Heads but One Brain: Fusion Brain -- a Competition and a Single Multimodal Multitask Architecture

...

405

22 Nov 2021

Attention Approximates Sparse Distributed MemoryNeural Information Processing Systems (NeurIPS), 2021

Trenton Bricken

Cengiz Pehlevan

340

10 Nov 2021

Inductive Biases and Variable Creation in Self-Attention Mechanisms

455

152

19 Oct 2021

The Power of Prompt Tuning for Low-Resource Semantic Parsing

Nathan Schucher

Siva Reddy

H. D. Vries

VLM

263

16 Oct 2021

Scaling Laws for the Few-Shot Adaptation of Pre-trained Image Classifiers

286

13 Oct 2021

Pretrained Language Models are Symbolic Mathematics Solvers too!

375

07 Oct 2021

Compositional generalization in semantic parsing with pretrained transformers

A. Orhan

303

30 Sep 2021

Cross-lingual Transfer of Monolingual Models

289

15 Sep 2021

TEASEL: A Transformer-Based Speech-Prefixed Language Model

Mehdi Arjmand

M. Dousti

H. Moradi

167

12 Sep 2021

Exploiting BERT For Multimodal Target Sentiment Classification Through Input Space Translation

Zaid Khan

Y. Fu

195

188

03 Aug 2021

Transformer-based Map Matching Model with Limited Ground-Truth Data using Transfer-Learning Approach

286

01 Aug 2021

Perceiver IO: A General Architecture for Structured Inputs & OutputsInternational Conference on Learning Representations (ICLR), 2021

Andrew Jaegle

Sebastian Borgeaud

Jean-Baptiste Alayrac

...

825

773

30 Jul 2021

Don't Sweep your Learning Rate under the Rug: A Closer Look at Cross-modal Transfer of Pretrained Transformers

303

26 Jul 2021

An Adapter Based Pre-Training for Efficient and Scalable Self-Supervised Speech Representation LearningIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

194

26 Jul 2021

Multimodal Few-Shot Learning with Frozen Language ModelsNeural Information Processing Systems (NeurIPS), 2021

661

938

25 Jun 2021

Going Beyond Linear Transformers with Recurrent Fast Weight ProgrammersNeural Information Processing Systems (NeurIPS), 2021

278

11 Jun 2021

Rethinking Architecture Design for Tackling Data Heterogeneity in Federated LearningComputer Vision and Pattern Recognition (CVPR), 2021

476

219

10 Jun 2021

Image2Point: 3D Point-Cloud Understanding with 2D Image Pretrained ModelsEuropean Conference on Computer Vision (ECCV), 2021

Wei Zhan

241

08 Jun 2021

Decision Transformer: Reinforcement Learning via Sequence ModelingNeural Information Processing Systems (NeurIPS), 2021

Aravind Rajeswaran

Pieter Abbeel

698

2,126

02 Jun 2021

Choose a Transformer: Fourier or GalerkinNeural Information Processing Systems (NeurIPS), 2021

Shuhao Cao

555

373

31 May 2021

Cross-Attention is All You Need: Adapting Pretrained Transformers for Machine TranslationConference on Empirical Methods in Natural Language Processing (EMNLP), 2021

Mozhdeh Gheini

Xiang Ren

Jonathan May

LRM

388

174

18 Apr 2021

Generalization over different cellular automata rules learned by a deep feed-forward neural network

185

27 Mar 2021