Improving sequence-to-sequence speech recognition training with
on-the-fly data augmentation

Improving sequence-to-sequence speech recognition training with on-the-fly data augmentation

29 October 2019

Papers citing "Improving sequence-to-sequence speech recognition training with on-the-fly data augmentation"

13 / 13 papers shown

Title
Data Augmentation Policy Search for Long-Term Forecasting Liran Nochumsohn Omri Azencot AI4TS TPM 48 3 0 01 May 2024
SegAugment: Maximizing the Utility of Speech Translation Data with Segmentation-based Augmentations Ioannis Tsiamas José A. R. Fonollosa Marta R. Costa-jussá 41 6 0 19 Dec 2022
Make More of Your Data: Minimal Effort Data Augmentation for Automatic Speech Recognition and Translation Tsz Kin Lam Shigehiko Schamoni Stefan Riezler VLM 44 8 0 27 Oct 2022
A Policy-based Approach to the SpecAugment Method for Low Resource E2E ASR Rui Li Guodong Ma Dexin Zhao Ranran Zeng Xiaoyu Li Haolin Huang 29 2 0 16 Oct 2022
Parameter-Efficient Conformers via Sharing Sparsely-Gated Experts for End-to-End Speech Recognition Ye Bai Jie Li W. Han Hao Ni Kaituo Xu Zhuo Zhang Cheng Yi Xiaorui Wang MoE 31 1 0 17 Sep 2022
ImportantAug: a data augmentation agent for speech V. Trinh Hassan Salami Kavaki Michael I. Mandel 27 10 0 14 Dec 2021
ChannelAugment: Improving generalization of multi-channel ASR by training with input channel randomization M. Gaudesi F. Weninger D. Sharma P. Zhan AAML 33 1 0 23 Sep 2021
Instant One-Shot Word-Learning for Context-Specific Neural Sequence-to-Sequence Speech Recognition Christian Huber Juan Hussain Sebastian Stüker A. Waibel 29 24 0 05 Jul 2021
Dealing with training and test segmentation mismatch: FBK@IWSLT2021 Sara Papi Marco Gaido Matteo Negri Marco Turchi 39 6 0 23 Jun 2021
Beyond Voice Activity Detection: Hybrid Audio Segmentation for Direct Speech Translation Marco Gaido Matteo Negri Mauro Cettolo Marco Turchi VLM 58 25 0 23 Apr 2021
Semi-Supervised Learning with Data Augmentation for End-to-End ASR F. Weninger F. Mana R. Gemello Jesús Andrés-Ferrer P. Zhan 25 30 0 27 Jul 2020
End-to-End Speech-Translation with Knowledge Distillation: FBK@IWSLT2020 Marco Gaido Mattia Antonino Di Gangi Matteo Negri Marco Turchi 19 53 0 04 Jun 2020
Single headed attention based sequence-to-sequence model for state-of-the-art results on Switchboard Zoltán Tüske G. Saon Kartik Audhkhasi Brian Kingsbury BDL 23 68 0 20 Jan 2020