OmniNet: Omnidirectional Representations from Transformers

International Conference on Machine Learning (ICML), 2021

1 March 2021

Zhen Qin

Papers citing "OmniNet: Omnidirectional Representations from Transformers"

19 / 19 papers shown

Anchored Diffusion Language Model

Litu Rout

Constantine Caramanis

Sanjay Shakkottai

362

24 May 2025

Variational Autoencoding Discrete Diffusion with Enhanced Dimensional Correlations Modeling

1.0K

23 May 2025

Continuous Diffusion Model for Language Modeling

Jaehyeong Jo

Sung Ju Hwang

210

17 Feb 2025

MUDDFormer: Breaking Residual Bottlenecks in Transformers via Multiway Dynamic Dense Connections

493

13 Feb 2025

Scaling Proprioceptive-Visual Learning with Heterogeneous Pre-trained TransformersNeural Information Processing Systems (NeurIPS), 2024

Lirui Wang

Xinlei Chen

Jialiang Zhao

Kaiming He

249

109

30 Sep 2024

CUPID: Improving Battle Fairness and Position Satisfaction in Online MOBA Games with a Re-matchmaking System

Junyang Chen

203

28 Jun 2024

Simple and Effective Masked Diffusion Language Models

Justin T Chiu

258

348

11 Jun 2024

Cached Transformers: Improving Transformers with Differentiable Memory Cache

Ping Luo

199

20 Dec 2023

FLORA: Fine-grained Low-Rank Architecture Search for Vision TransformerIEEE Workshop/Winter Conference on Applications of Computer Vision (WACV), 2023

Chi-Chih Chang

167

07 Nov 2023

QuickSkill: Novice Skill Estimation in Online Multiplayer GamesInternational Conference on Information and Knowledge Management (CIKM), 2022

Hao Chen

124

15 Aug 2022

Adaptive Cross-Layer Attention for Image Restoration

Yancheng Wang

N. Xu

Yingzhen Yang

273

04 Mar 2022

ViNMT: Neural Machine Translation Toolkit

Nguyen Hoang Quan

N. T. Dat

Nguyen Hoang Minh Cong

315

31 Dec 2021

Rank4Class: A Ranking Formulation for Multiclass Classification

Zhen Qin

128

17 Dec 2021

The Efficiency MisnomerInternational Conference on Learning Representations (ICLR), 2021

275

112

25 Oct 2021

SCENIC: A JAX Library for Computer Vision Research and Beyond

202

18 Oct 2021

Exploring the Limits of Large Scale Pre-training

208

133

05 Oct 2021

Long-Short Transformer: Efficient Transformers for Language and Vision

435

159

05 Jul 2021

KVT: k-NN Attention for Boosting Vision TransformersEuropean Conference on Computer Vision (ECCV), 2021

Hao Li

253

129

28 May 2021

Dispatcher: A Message-Passing Approach To Language Modelling

A. Cetoli

133

09 May 2021