AISHELL-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline

16 September 2017

Hui Bu

Papers citing "AISHELL-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline"

50 / 451 papers shown

Multi-mode Transformer Transducer with Stochastic Future ContextInterspeech (Interspeech), 2021

Kwangyoun Kim

17 Jun 2021

Efficient Conformer with Prob-Sparse Attention Mechanism for End-to-EndSpeech Recognition

Xiong Wang

Sining Sun

Lei Xie

Long Ma

113

17 Jun 2021

Layer Pruning on Demand with Intermediate CTC

Jaesong Lee

Jingu Kang

Shinji Watanabe

129

17 Jun 2021

U2++: Unified Two-pass Bidirectional End-to-end Model for Speech Recognition

Di Wu

Binbin Zhang

Chao Yang

218

10 Jun 2021

SpeechBrain: A General-Purpose Speech Toolkit

Mirco Ravanelli

Titouan Parcollet

Peter William VanHarn Plantinga

...

293

901

08 Jun 2021

Signal Transformer: Complex-valued Attention and Meta-Learning for Signal RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

399

05 Jun 2021

A Preliminary Study of a Two-Stage Paradigm for Preserving Speaker Identity in Dysarthric Voice ConversionInterspeech (Interspeech), 2021

147

02 Jun 2021

Improving the Adversarial Robustness for Speaker Verification by Self-Supervised LearningIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2021

Haibin Wu

Zhiyong Wu

257

01 Jun 2021

FastCorrect: Fast Error Correction with Edit Alignment for Automatic Speech RecognitionNeural Information Processing Systems (NeurIPS), 2021

Xu Tan

Xiang-Yang Li

251

09 May 2021

Latency-Controlled Neural Architecture Search for Streaming Speech RecognitionAutomatic Speech Recognition & Understanding (ASRU), 2021

233

08 May 2021

Efficient conformer-based speech recognition with linear attentionAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2021

Shengqiang Li

Menglong Xu

Xiao-Lei Zhang

194

14 Apr 2021

Improved Conformer-based End-to-End Speech Recognition Using Neural Architecture Search

Pengyuan Zhang

117

12 Apr 2021

A Toolbox for Construction and Analysis of Speech Datasets

Evelina Bakhturina

Vitaly Lavrukhin

Boris Ginsburg

139

11 Apr 2021

Non-autoregressive Transformer-based End-to-end ASR using BERTIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2021

Fu-Hao Yu

Kuan-Yu Chen

141

10 Apr 2021

Boundary and Context Aware Training for CIF-based Non-Autoregressive End-to-end ASRAutomatic Speech Recognition & Understanding (ASRU), 2021

Lei Xie

105

10 Apr 2021

AISHELL-4: An Open Source Dataset for Speech Enhancement, Separation, Recognition and Speaker Diarization in Conference ScenarioInterspeech (Interspeech), 2021

Yuxiang Kong

...

Jian Wu

Hui Bu

Xin Xu

Jun Du

Jingdong Chen

320

134

08 Apr 2021

WNARS: WFST based Non-autoregressive Streaming End-to-End Speech Recognition

142

08 Apr 2021

Darts-Conformer: Towards Efficient Gradient-Based Neural Architecture Search For End-to-End ASR

Xian Shi

Pan Zhou

Wei Chen

Lei Xie

149

07 Apr 2021

Relaxing the Conditional Independence Assumption of CTC-based ASR by Conditioning on Intermediate PredictionsInterspeech (Interspeech), 2021

Jumon Nozaki

Tatsuya Komatsu

254

06 Apr 2021

Extremely Low Footprint End-to-End ASR System for Smart DeviceInterspeech (Interspeech), 2021

104

06 Apr 2021

Non-autoregressive Mandarin-English Code-switching Speech RecognitionAutomatic Speech Recognition & Understanding (ASRU), 2021

230

06 Apr 2021

INTERSPEECH 2021 ConferencingSpeech Challenge: Towards Far-field Multi-Channel Speech Enhancement for Video Conferencing

Xin Xu

...

Hui Bu

149

02 Apr 2021

TeCANet: Temporal-Contextual Attention Network for Environment-Aware Speech DereverberationInterspeech (Interspeech), 2021

Helin Wang

147

31 Mar 2021

MediaSpeech: Multilanguage ASR Benchmark and Dataset

122

30 Mar 2021

Transformer-based end-to-end speech recognition with residual Gaussian-based self-attentionInterspeech (Interspeech), 2021

Chen Liang

Menglong Xu

Xiao-Lei Zhang

191

29 Mar 2021

Mutually-Constrained Monotonic Multihead Attention for Online ASRIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Jae-gyun Song

Hajin Shim

Eunho Yang

26 Mar 2021

BART based semantic correction for Mandarin automatic speech recognition systemInterspeech (Interspeech), 2021

145

26 Mar 2021

USTC-NELSLIP System Description for DIHARD-III Challenge

Shutong Niu

Tian Gao

Jia Pan

143

19 Mar 2021

ATCSpeechNet: A multilingual end-to-end speech recognition framework for air traffic control systemsApplied Soft Computing (Appl Soft Comput), 2021

Hu Chen

Yi Zhang

159

17 Feb 2021

Improving speech recognition models with small samples for air traffic control systemsNeurocomputing (Neurocomputing), 2021

182

16 Feb 2021

Fast End-to-End Speech Recognition via Non-Autoregressive Models and Cross-Modal Knowledge Transferring from BERTIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2021

Jiangyan Yi

208

15 Feb 2021

Intermediate Loss Regularization for CTC-based Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Jaesong Lee

Shinji Watanabe

251

157

05 Feb 2021

Towards Natural and Controllable Cross-Lingual Voice Conversion Based on Neural TTS Model and Phonetic PosteriorgramIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

128

03 Feb 2021

WeNet: Production oriented Streaming and Non-streaming End-to-End Speech Recognition ToolkitInterspeech (Interspeech), 2021

Binbin Zhang

Chao Yang

Lei Xie

355

307

02 Feb 2021

Speech Recognition by Simply Fine-tuning BERTIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

255

30 Jan 2021

A phonetic model of non-native spoken word processingConference of the European Chapter of the Association for Computational Linguistics (EACL), 2021

273

27 Jan 2021

Interspeech 2021 Deep Noise Suppression ChallengeInterspeech (Interspeech), 2021

415

189

06 Jan 2021

A Principle Solution for Enroll-Test Mismatch in Speaker RecognitionIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2020

Dong Wang

138

23 Dec 2020

CN-Celeb: multi-genre speaker recognitionSpeech Communication (Speech Commun.), 2020

Hao Cui

Dong Wang

209

142

23 Dec 2020

Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition

Binbin Zhang

Chao Yang

Liyong Guo

Yaguang Hu

Lei Xie

X. Lei

246

10 Dec 2020

Transformer-Transducers for Code-Switched Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

222

30 Nov 2020

Cascade RNN-Transducer: Syllable Based Streaming On-device Mandarin Speech Recognition with a Syllable-to-Character ConverterSpoken Language Technology Workshop (SLT), 2020

Xiong Wang

Zhuoyuan Yao

Xian Shi

Lei Xie

131

17 Nov 2020

Gated Recurrent Fusion with Joint Training Framework for Robust End-to-End Speech Recognition

Jiangyan Yi

122

09 Nov 2020

Stochastic Attention Head Removal: A simple and effective method for improving Transformer Based ASR Models

Shucong Zhang

Erfan Loweimi

P. Bell

Steve Renals

215

08 Nov 2020

IEEE SLT 2021 Alpha-mini Speech Challenge: Open Datasets, Tracks, Rules and Baselines

...

Lei Xie

Dongyan Huang

Hui Bu

P. Motlícek

J. Odobez

143

04 Nov 2020

Improving RNN transducer with normalized jointer network

Yang Zhang

203

03 Nov 2020

Training Wake Word Detection with Synthesized Speech Data on Confusion Words

03 Nov 2020

Non-Autoregressive Transformer ASR with CTC-Enhanced Decoder InputIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

Zhiyong Wu

168

28 Oct 2020

INT8 Winograd Acceleration for Conv1D Equipped ASR Models Deployed on Mobile Devices

Chengyu Wang

...

159

28 Oct 2020

CASS-NAT: CTC Alignment-based Single Step Non-autoregressive Transformer for Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2020

146

28 Oct 2020