v1v2v3v4 (latest)

Zoneout: Regularizing RNNs by Randomly Preserving Hidden Activations

International Conference on Learning Representations (ICLR), 2016

3 June 2016

Aaron Courville

Papers citing "Zoneout: Regularizing RNNs by Randomly Preserving Hidden Activations"

50 / 180 papers shown

Quantifying and Alleviating Co-Adaptation in Sparse-View 3D Gaussian Splatting

189

18 Aug 2025

Y-Drop: A Conductance based Dropout for fully connected layers

Efthymios Georgiou

Georgios Paraskevopoulos

Alexandros Potamianos

188

11 Sep 2024

Advancing Spiking Neural Networks towards Multiscale Spatiotemporal Interaction Learning

289

22 May 2024

Exploiting Symmetric Temporally Sparse BPTT for Efficient RNN TrainingAAAI Conference on Artificial Intelligence (AAAI), 2023

199

14 Dec 2023

RigLSTM: Recurrent Independent Grid LSTM for Generalizable Sequence Learning

213

03 Nov 2023

Decision ConvFormer: Local Filtering in MetaFormer is Sufficient for Decision MakingInternational Conference on Learning Representations (ICLR), 2023

300

04 Oct 2023

Modularity in Deep Learning: A Survey

Haozhe Sun

Isabelle Guyon

MoMe

312

02 Oct 2023

Chunked Attention-based Encoder-Decoder Model for Streaming Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

306

15 Sep 2023

A Comprehensive Overview of Large Language ModelsACM Transactions on Intelligent Systems and Technology (ACM TIST), 2023

Saeed Anwar

Muhammad Usman

854

1,173

12 Jul 2023

SeqAug: Sequential Feature Resampling as a modality agnostic augmentation method

Efthymios Georgiou

Alexandros Potamianos

164

03 May 2023

DropDim: A Regularization Method for Transformer NetworksIEEE Signal Processing Letters (IEEE SPL), 2023

190

20 Apr 2023

Optimum Output Long Short-Term Memory Cell for High-Frequency Trading Forecasting

209

17 Apr 2023

End-to-End Speech Recognition: A SurveyIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2023

285

243

03 Mar 2023

A Review of the Role of Causality in Developing Trustworthy AI Systems

...

321

14 Feb 2023

State-Regularized Recurrent Neural Networks to Extract Automata and Explain PredictionsIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Cheng Wang

Carolin (Haas) Lawrence

Mathias Niepert

215

10 Dec 2022

Efficient Transformers with Dynamic Token PoolingAnnual Meeting of the Association for Computational Linguistics (ACL), 2022

238

17 Nov 2022

Learning Sequence Representations by Non-local Recurrent Neural MemoryInternational Journal of Computer Vision (IJCV), 2022

289

20 Jul 2022

ZoDIAC: Zoneout Dropout Injection Attention Calculation

Zanyar Zohourianshahzadi

Terrance Boult

Jugal Kalita

245

28 Jun 2022

RF-Next: Efficient Receptive Field Search for Convolutional Neural NetworksIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2022

Shanghua Gao

Zhong-Yu Li

Qi Han

Ming-Ming Cheng

Liang Wang

299

14 Jun 2022

Efficient recurrent architectures through activity sparsity and sparse back-propagation through timeInternational Conference on Learning Representations (ICLR), 2022

Anand Subramoney

Khaleelulla Khan Nazeer

Mark Schöne

Christian Mayr

David Kappel

327

13 Jun 2022

Temporal Latent Bottleneck: Synthesis of Fast and Slow Processing Mechanisms in Sequence LearningNeural Information Processing Systems (NeurIPS), 2022

Aniket Didolkar

Kshitij Gupta

Anirudh Goyal

Nitesh B. Gundavarapu

450

30 May 2022

A Survey on Dropout Methods and Experimental Verification in RecommendationIEEE Transactions on Knowledge and Data Engineering (TKDE), 2022

300

05 Apr 2022

Look Backward and Forward: Self-Knowledge Distillation with Bidirectional Decoder for Neural Machine Translation

187

10 Mar 2022

Improving End-to-End Models for Set Prediction in Spoken Language UnderstandingIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

128

28 Jan 2022

Zero-Shot Long-Form Voice Cloning with Dynamic Convolution Attention

Artem Gorodetskii

Ivan Ozhiganov

182

25 Jan 2022

Sparse-Dyn: Sparse Dynamic Graph Multi-representation Learning via Event-based Sparse Temporal Attention NetworkInternational Journal of Intelligent Systems (IJIS), 2022

Yan Pang

Chao Liu

329

04 Jan 2022

Prosodic Clustering for Phoneme-level Prosody Control in End-to-End Speech SynthesisIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Aimilios Chalamandaris

Pirros Tsiakoulis

150

19 Nov 2021

Rapping-Singing Voice Synthesis based on Phoneme-level Prosody Control

...

Aimilios Chalamandaris

143

17 Nov 2021

High Quality Streaming Speech Synthesis with Low, Sentence-Length-Independent Latency

Nikolaos Ellinas

G. Vamvoukakis

K. Markopoulos

Aimilios Chalamandaris

194

17 Nov 2021

Meta-Forecasting by combining Global Deep Representations with Local Adaptation

193

05 Nov 2021

Preventing posterior collapse in variational autoencoders for text generation via decoder regularization

Alban Petit

Caio Corro

DRL

214

28 Oct 2021

Long Expressive Memory for Sequence ModelingInternational Conference on Learning Representations (ICLR), 2021

443

10 Oct 2021

ChiNet: Deep Recurrent Convolutional Learning for Multimodal Spacecraft Pose EstimationIEEE Transactions on Aerospace and Electronic Systems (T-AES), 2021

170

23 Aug 2021

Translatotron 2: High-quality direct speech-to-speech translation with voice preservationInternational Conference on Machine Learning (ICML), 2021

Ye Jia

Michelle Tadmor Ramanovich

Tal Remez

Roi Pomerantz

416

19 Jul 2021

Discrete-Valued Neural Communication

260

06 Jul 2021

Structured in Space, Randomized in Time: Leveraging Dropout in RNNs for Efficient TrainingNeural Information Processing Systems (NeurIPS), 2021

22 Jun 2021

Recurrent Neural Network from Adder's Perspective: Carry-lookahead RNNNeural Networks (NN), 2021

Yong Peng

143

22 Jun 2021

Adaptive Low-Rank Regularization with Damping Sequences to Restrict Lazy Weights in Deep Networks

Mohammad Mahdi Bejani

M. Ghatee

AI4CE

17 Jun 2021

WaveGrad 2: Iterative Refinement for Text-to-Speech SynthesisInterspeech (Interspeech), 2021

Najim Dehak

213

17 Jun 2021

On the limit of English conversational speech recognitionInterspeech (Interspeech), 2021

Zoltán Tüske

G. Saon

Brian Kingsbury

183

03 May 2021

Investigating Methods to Improve Language Model Integration for Attention-based Encoder-Decoder ASR ModelsInterspeech (Interspeech), 2021

180

12 Apr 2021

Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition ArchitecturesAutomatic Speech Recognition & Understanding (ASRU), 2021

170

12 Apr 2021

UniDrop: A Simple yet Effective Technique to Improve Transformer without Extra CostNorth American Chapter of the Association for Computational Linguistics (NAACL), 2021

201

11 Apr 2021

Librispeech Transducer Model with Internal Language Model Prior CorrectionInterspeech (Interspeech), 2021

134

07 Apr 2021

Noise Injection-based Regularization for Point Cloud Processing

Jie Chen

122

28 Mar 2021

LocalDrop: A Hybrid Regularization for Deep Neural NetworksIEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2021

Bo Du

177

01 Mar 2021

Zero Training Overhead Portfolios for Learning to Solve Combinatorial Problems

Yiwei Bai

Wenting Zhao

Daniel Schwalbe-Koda

218

05 Feb 2021

Distilling Large Language Models into Tiny and Effective Students using pQRNN

135

21 Jan 2021

Sequential Deep Learning for Credit Risk Monitoring with Tabular Financial Data

174

30 Dec 2020

Regularizing Recurrent Neural Networks via Sequence Mixup

Armin Karamzade

Amir Najafi

S. Motahari

118

27 Nov 2020