AISHELL-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline

16 September 2017

Hui Bu

Papers citing "AISHELL-1: An Open-Source Mandarin Speech Corpus and A Speech Recognition Baseline"

50 / 451 papers shown

Integrating Lattice-Free MMI into End-to-End Speech RecognitionIEEE/ACM Transactions on Audio Speech and Language Processing (TASLP), 2022

283

29 Mar 2022

WeNet 2.0: More Productive End-to-End Speech Recognition ToolkitInterspeech (Interspeech), 2022

Binbin Zhang

Chao Yang

274

127

29 Mar 2022

Shifted Chunk Encoder for Transformer Based Streaming End-to-End ASRInternational Conference on Neural Information Processing (ICONIP), 2022

Fangyuan Wang

Bo Xu

158

29 Mar 2022

Analyzing Language-Independent Speaker Anonymization Framework under Unseen ConditionsInterspeech (Interspeech), 2022

Xin Wang

131

28 Mar 2022

Disentangleing Content and Fine-grained Prosody Information via Hybrid ASR Bottleneck Features for Voice ConversionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Xintao Zhao

Feng Liu

Changhe Song

Zhiyong Wu

Shiyin Kang

Deyi Tuo

Helen Meng

165

24 Mar 2022

Variational Auto-Encoder based Mandarin Speech Cloning

Qingyu Xing

Xiaohan Ma

177

06 Mar 2022

Language-Independent Speaker Anonymization Approach using Self-Supervised Pre-Trained ModelsThe Speaker and Language Recognition Workshop (Odyssey), 2022

Xin Wang

354

26 Feb 2022

Improving CTC-based speech recognition via knowledge transferring from pre-trained language modelsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Pengyuan Zhang

132

22 Feb 2022

AISHELL-NER: Named Entity Recognition from Chinese SpeechIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Fei Huang

126

17 Feb 2022

ADD 2022: the First Audio Deep Synthesis Detection ChallengeIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Jiangyan Yi

...

Haizhou Li

249

235

17 Feb 2022

Run-and-back stitch search: novel block synchronous decoding for streaming encoder-decoder ASRIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

140

25 Jan 2022

Improving non-autoregressive end-to-end speech recognition with pre-trained acoustic and language modelsIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2022

Pengyuan Zhang

194

25 Jan 2022

A Study of Transducer based End-to-End ASR with ESPnet: Architecture, Auxiliary Loss and Decoding StrategiesAutomatic Speech Recognition & Understanding (ASRU), 2021

260

14 Jan 2022

Cross-Modal ASR Post-Processing System for Error Correction and Utterance Rejection

242

10 Jan 2022

Automatic Speech Recognition Datasets in Cantonese: A Survey and New DatasetInternational Conference on Language Resources and Evaluation (LREC), 2022

Cheuk Tung Shadow Yiu

...

Bertram E. Shi

221

07 Jan 2022

Improving Mandarin End-to-End Speech Recognition with Word N-gram Language ModelIEEE Signal Processing Letters (SPL), 2022

Yuexian Zou

179

06 Jan 2022

Generating Adversarial Samples For Training Wake-up Word Detection Systems Against Confusing Words

191

01 Jan 2022

Integrating Knowledge in End-to-End Automatic Speech Recognition for Mandarin-English Code-SwitchingInternational Conference on Asian Language Processing (IALP), 2019

Chia-Yu Li

Ngoc Thang Vu

150

19 Dec 2021

Improving Hybrid CTC/Attention End-to-end Speech Recognition with Pretrained Acoustic and Language Model

14 Dec 2021

Improving Code-switching Language Modeling with Artificially Generated Texts using Cycle-consistent Adversarial Networks

Chia-Yu Li

Ngoc Thang Vu

108

12 Dec 2021

ASCEND: A Spontaneous Chinese-English Dataset for Code-switching in Multi-turn Conversation

...

Bertram E. Shi

397

12 Dec 2021

Speaker Embedding-aware Neural Diarization for Flexible Number of Speakers with Textual Information

Siqi Zheng

187

28 Nov 2021

A Study on Decoupled Probabilistic Linear Discriminant Analysis

Ding Wang

Lantian Li

Hongzhi Yu

Dong Wang

24 Nov 2021

Multi-Channel Multi-Speaker ASR Using 3D Spatial FeatureIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Yiwen Shao

Shi-Xiong Zhang

Dong Yu

146

22 Nov 2021

Improving Prosody for Unseen Texts in Speech Synthesis by Utilizing Linguistic Information and Noisy Data

137

15 Nov 2021

M2MeT: The ICASSP 2022 Multi-Channel Multi-Party Meeting Transcription Challenge

Fan Yu

Shiliang Zhang

Yihui Fu

Lei Xie

Siqi Zheng

...

Pengcheng Guo

Zhijie Yan

B. Ma

Xin Xu

Hui Bu

235

160

14 Oct 2021

SRU++: Pioneering Fast Recurrence with Attention for Speech RecognitionIEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2021

Kwangyoun Kim

104

11 Oct 2021

An Exploration of Self-Supervised Pretrained Representations for End-to-End Speech RecognitionAutomatic Speech Recognition & Understanding (ASRU), 2021

...

Tianzi Wang

171

09 Oct 2021

Data Augmentation with Locally-time Reversed Speech for Automatic Speech Recognition

Si-Ioi Ng

Tan Lee

135

09 Oct 2021

Wav2vec-S: Semi-Supervised Pre-Training for Low-Resource ASRInterspeech (Interspeech), 2021

Pengyuan Zhang

250

09 Oct 2021

SCaLa: Supervised Contrastive Learning for End-to-End Speech RecognitionInterspeech (Interspeech), 2021

153

08 Oct 2021

WenetSpeech: A 10000+ Hours Multi-domain Mandarin Corpus for Speech Recognition

Binbin Zhang

Hang Lv

Pengcheng Guo

Qijie Shao

Chao Yang

...

Hui Bu

407

286

07 Oct 2021

DistilHuBERT: Speech Representation Learning by Layer-wise Distillation of Hidden-unit BERT

610

202

05 Oct 2021

FastCorrect 2: Fast Error Correction on Multiple Candidates for Automatic Speech Recognition

Xu Tan

...

Xiang-Yang Li

283

29 Sep 2021

Wav-BERT: Cooperative Acoustic and Linguistic Representation Learning for Low-Resource Speech Recognition

Xiaodan Liang

202

19 Sep 2021

Non-autoregressive Transformer with Unified Bidirectional Decoder for Automatic Speech Recognition

143

14 Sep 2021

Cross-domain Single-channel Speech Enhancement Model with Bi-projection Fusion Module for Noise-robust ASRIEEE International Conference on Multimedia and Expo (ICME), 2021

Fu-An Chao

J. Hung

Berlin Chen

136

26 Aug 2021

Greenformers: Improving Computation and Memory Efficiency in Transformer Models via Low-Rank Approximation

Samuel Cahyawijaya

192

24 Aug 2021

Decoupling recognition and transcription in Mandarin ASR

172

02 Aug 2021

Automatic recognition of suprasegmentals in speech

128

02 Aug 2021

USC: An Open-Source Uzbek Speech Corpus and Initial Speech Recognition ExperimentsInternational Conference on Speech and Computer (SPECOM), 2021

Yerbolat Khassanov

30 Jul 2021

Multi-channel Speech Enhancement with 2-D Convolutional Time-frequency Domain Features and a Pre-trained Acoustic ModelAsia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), 2021

Liyong Guo

Yujun Wang

231

23 Jul 2021

Streaming End-to-End ASR based on Blockwise Non-Autoregressive ModelsInterspeech (Interspeech), 2021

Tianzi Wang

Yuya Fujita

Xuankai Chang

Shinji Watanabe

194

20 Jul 2021

Multi-Task Audio Source Separation

134

14 Jul 2021

Conformer-based End-to-end Speech Recognition With Rotary Position Embedding

Shengqiang Li

Menglong Xu

Xiao-Lei Zhang

200

13 Jul 2021

Multilingual and crosslingual speech recognition using phonological-vector based phone embeddings

Chengrui Zhu

Keyu An

Huahuan Zheng

Zhijian Ou

205

11 Jul 2021

The HCCL Speaker Verification System for Far-Field Speaker Verification Challenge

Zhuo Li

125

03 Jul 2021

A Survey on Neural Speech Synthesis

Xu Tan

344

435

29 Jun 2021

SRIB-LEAP submission to Far-field Multi-Channel Speech Enhancement Challenge for Video Conferencing

R. Raj

Rohit Kumar

M. Jayesh

Anurenjan Purushothaman

Sriram Ganapathy

Basha Shaik

24 Jun 2021

An Improved Single Step Non-autoregressive Transformer for Automatic Speech RecognitionInterspeech (Interspeech), 2021

238

18 Jun 2021