v1v2 (latest)

Perceiver: General Perception with Iterative Attention

International Conference on Machine Learning (ICML), 2021

4 March 2021

ArXiv (abs)PDF HTML HuggingFace (2 upvotes)

Papers citing "Perceiver: General Perception with Iterative Attention"

50 / 790 papers shown

Wayformer: Motion Forecasting via Simple & Efficient Attention NetworksIEEE International Conference on Robotics and Automation (ICRA), 2022

303

350

12 Jul 2022

MaiT: Leverage Attention Masks for More Efficient Image Transformers

Ling Li

Ali Shafiee Ardestani

Joseph Hassoun

123

06 Jul 2022

Pure Transformers are Powerful Graph LearnersNeural Information Processing Systems (NeurIPS), 2022

392

248

06 Jul 2022

Softmax-free Linear TransformersInternational Journal of Computer Vision (IJCV), 2022

Jiachen Lu

Junge Zhang

Xiatian Zhu

Jianfeng Feng

Tao Xiang

Li Zhang

ViT

211

05 Jul 2022

Conditioned Human Trajectory Prediction using Iterative Attention BlocksIEEE International Conference on Robotics and Automation (ICRA), 2022

A. Postnikov

A. Gamayunov

Gonzalo Ferrer

168

29 Jun 2022

Deformable Graph TransformerIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

245

29 Jun 2022

A Unified Sequence Interface for Vision TasksNeural Information Processing Systems (NeurIPS), 2022

David J. Fleet

208

171

15 Jun 2022

Human Eyes Inspired Recurrent Neural Networks are More Robust Against Adversarial NoisesNeural Computation (Neural Comput.), 2022

Minkyu Choi

Yizhen Zhang

Kuan Han

Xiaokai Wang

Zhongming Liu

AAML GAN

139

15 Jun 2022

It's Time for Artistic Correspondence in Music and VideoComputer Vision and Pattern Recognition (CVPR), 2022

Dídac Surís

Carl Vondrick

Bryan C. Russell

Justin Salamon

151

14 Jun 2022

Peripheral Vision TransformerNeural Information Processing Systems (NeurIPS), 2022

238

14 Jun 2022

Multimodal Learning with Transformers: A SurveyIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

556

841

13 Jun 2022

Bringing Image Scene Structure to Video via Frame-Clip Consistency of Object Tokens

301

13 Jun 2022

ChordMixer: A Scalable Neural Attention Model for Sequences with Different LengthsInternational Conference on Learning Representations (ICLR), 2022

207

12 Jun 2022

Uni-Perceiver-MoE: Learning Sparse Generalist Models with Conditional MoEsNeural Information Processing Systems (NeurIPS), 2022

301

09 Jun 2022

GateHUB: Gated History Unit with Background Suppression for Online Action DetectionComputer Vision and Pattern Recognition (CVPR), 2022

237

09 Jun 2022

Revealing Single Frame Bias for Video-and-Language LearningAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

Jie Lei

Tamara L. Berg

Joey Tianyi Zhou

236

141

07 Jun 2022

Fair Classification via Transformer Neural Networks: Case Study of an Educational Domain

Modar Sulaiman

Kallol Roy

232

03 Jun 2022

SymFormer: End-to-end symbolic regression using transformer-based architectureIEEE Access (IEEE Access), 2022

379

31 May 2022

Temporal Latent Bottleneck: Synthesis of Fast and Slow Processing Mechanisms in Sequence LearningNeural Information Processing Systems (NeurIPS), 2022

Aniket Didolkar

Kshitij Gupta

Anirudh Goyal

Nitesh B. Gundavarapu

454

30 May 2022

Multimodal Masked Autoencoders Learn Transferable Representations

Pieter Abbeel

349

132

27 May 2022

Transformer for Partial Differential Equations' Operator Learning

Zijie Li

Kazem Meidani

A. Farimani

359

252

26 May 2022

Semi-Parametric Inducing Point Networks and Neural ProcessesInternational Conference on Learning Representations (ICLR), 2022

288

24 May 2022

Dynamic Query Selection for Fast Visual Perceiver

Corentin Dancette

Matthieu Cord

134

22 May 2022

Equivariant Mesh Attention Networks

221

21 May 2022

Visual Concepts TokenizationNeural Information Processing Systems (NeurIPS), 2022

237

20 May 2022

Towards Unified Keyframe Propagation Models

124

19 May 2022

Meta-Learning Sparse Compression Networks

Jonathan Richard Schwarz

Yee Whye Teh

256

18 May 2022

Vision Transformer Adapter for Dense PredictionsInternational Conference on Learning Representations (ICLR), 2022

Yu Qiao

894

755

17 May 2022

CONSENT: Context Sensitive Transformer for Bold Words Classification

Ionut Sandu

Daniel Voinea

A. Popa

137

16 May 2022

ImageSig: A signature transform for ultra-lightweight image recognition

Mohamed Ramzy Ibrahim

Terry Lyons

VLM

205

13 May 2022

Cross Domain Object Detection by Target-Perceived Dual Branch DistillationComputer Vision and Pattern Recognition (CVPR), 2022

Yu Qiao

218

03 May 2022

Flamingo: a Visual Language Model for Few-Shot LearningNeural Information Processing Systems (NeurIPS), 2022

Jean-Baptiste Alayrac

...

695

4,861

29 Apr 2022

Autonomous In-Situ Soundscape Augmentation via Joint Selection of Masker and GainIEEE Signal Processing Letters (SPL), 2022

Karn N. Watcharasupat

146

29 Apr 2022

Pseudo strong labels for large scale weakly supervised audio taggingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Yujun Wang

110

28 Apr 2022

The Wisdom of Crowds: Temporal Progressive Attention for Early Action PredictionComputer Vision and Pattern Recognition (CVPR), 2022

Alexandros Stergiou

Dima Damen

AI4TS EgoV EDL

171

28 Apr 2022

Attention Mechanism in Neural Networks: Where it Comes and Where it Goes

Derya Soydaner

3DV

279

290

27 Apr 2022

Revealing Occlusions with 4D Neural FieldsComputer Vision and Pattern Recognition (CVPR), 2022

Carl Vondrick

148

22 Apr 2022

Future Object Detection with Spatiotemporal Transformers

Adam Tonderski

Joakim Johnander

Christoffer Petersson

Kalle AAstrom

ViT

189

21 Apr 2022

Visio-Linguistic Brain EncodingInternational Conference on Computational Linguistics (COLING), 2022

18 Apr 2022

Visual Attention Methods in Deep Learning: An In-Depth SurveyInformation Fusion (Inf. Fusion), 2022

Saeed Anwar

338

247

16 Apr 2022

Malceiver: Perceiver with Hierarchical and Multi-modal Features for Android Malware Detection

Niall McLaughlin

144

12 Apr 2022

Probabilistic Compositional Embeddings for Multimodal Image Retrieval

267

12 Apr 2022

Linear Complexity Randomized Self-attention MechanismInternational Conference on Machine Learning (ICML), 2022

Lin Zheng

Chong-Jun Wang

Lingpeng Kong

187

10 Apr 2022

MAESTRO: Matched Speech Text Representations through Modality MatchingInterspeech (Interspeech), 2022

Zhehuai Chen

Yu Zhang

Andrew Rosenberg

Bhuvana Ramabhadran

Pedro J. Moreno

Ankur Bapna

Heiga Zen

244

119

07 Apr 2022

Event Transformer. A sparse-aware solution for efficient event data processing

Alberto Sabater

Luis Montesano

Ana C. Murillo

223

07 Apr 2022

ReSTR: Convolution-free Referring Image Segmentation Using TransformersComputer Vision and Pattern Recognition (CVPR), 2022

345

178

31 Mar 2022

RFNet-4D++: Joint Object Reconstruction and Flow Estimation from 4D Point Clouds with Cross-Attention Spatio-Temporal Features

235

30 Mar 2022

Unsupervised Learning of Temporal Abstractions with Slot-based TransformersNeural Computation (Neural Comput.), 2022

Anand Gopalakrishnan

Kazuki Irie

Jürgen Schmidhuber

Sjoerd van Steenkiste

OffRL

387

25 Mar 2022

Transform your Smartphone into a DSLR Camera: Learning the ISP in the WildEuropean Conference on Computer Vision (ECCV), 2022

A. S. Tripathi

Martin Danelljan

Samarth Shukla

Radu Timofte

Luc Van Gool

292

20 Mar 2022

Integrating Language Guidance into Vision-based Deep Metric LearningComputer Vision and Pattern Recognition (CVPR), 2022

207

16 Mar 2022