Massively Multilingual ASR on 70 Languages: Tokenization, Architecture,
and Generalization Capabilities

Massively Multilingual ASR on 70 Languages: Tokenization, Architecture, and Generalization Capabilities

10 November 2022

Ozlem Kalinli

Abdel-rahman Mohamed

Papers citing "Massively Multilingual ASR on 70 Languages: Tokenization, Architecture, and Generalization Capabilities"

11 / 11 papers shown

Title
LinTO Audio and Textual Datasets to Train and Evaluate Automatic Speech Recognition in Tunisian Arabic Dialect Hedi Naouara Jean-Pierre Lorré Jérôme Louradour 49 0 0 03 Apr 2025
Application of Audio Fingerprinting Techniques for Real-Time Scalable Speech Retrieval and Speech Clusterization Kemal Altwlkany Sead Delalic Adis Alihodzic Elmedin Selmanovic Damir Hasić 38 0 0 29 Oct 2024
Romanization Encoding For Multilingual ASR Wen Ding Fei Jia Hainan Xu Yu Xi Junjie Lai Boris Ginsburg 29 0 0 05 Jul 2024
Rapid Language Adaptation for Multilingual E2E Speech Recognition Using Encoder Prompting Yosuke Kashiwagi Hayato Futami E. Tsunoo Siddhant Arora Shinji Watanabe 29 1 0 18 Jun 2024
GigaSpeech 2: An Evolving, Large-Scale and Multi-domain ASR Corpus for Low-Resource Languages with Automated Crawling, Transcription and Refinement Yifan Yang Zheshu Song Jianheng Zhuo Mingyu Cui Jinpeng Li ... Shuai Fan Kai Yu Wei-Qiang Zhang Guoguo Chen Xie Chen 14 8 0 17 Jun 2024
Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision Saierdaer Yusuyin Te Ma Hao Huang Wenbo Zhao Zhijian Ou 44 2 0 04 Jun 2024
IndicVoices: Towards building an Inclusive Multilingual Speech Dataset for Indian Languages Tahir Javed J. Nawale E. George Sakshi Joshi Kaushal Bhogale ... M. ManickamK C. V. Vaijayanthi Krishnan Srinivasa Raghavan Karunganni Pratyush Kumar Mitesh M Khapra 31 16 0 04 Mar 2024
Dynamic ASR Pathways: An Adaptive Masking Approach Towards Efficient Pruning of A Multilingual ASR Model Jiamin Xie Ke Li Jinxi Guo Andros Tjandra Shangguan Yuan Leda Sari Chunyang Wu J. Jia Jay Mahadeokar Ozlem Kalinli 20 2 0 22 Sep 2023
Scaling Speech Technology to 1,000+ Languages Vineel Pratap Andros Tjandra Bowen Shi Paden Tomasello Arun Babu ... Yossi Adi Xiaohui Zhang Wei-Ning Hsu Alexis Conneau Michael Auli VLM 77 298 0 22 May 2023
Comparison of Multilingual Self-Supervised and Weakly-Supervised Speech Pre-Training for Adaptation to Unseen Languages Andrew Rouditchenko Sameer Khurana Samuel Thomas Rogerio Feris Leonid Karlinsky Hilde Kuehne David F. Harwath Brian Kingsbury James R. Glass VLM 34 22 0 21 May 2023
Emformer: Efficient Memory Transformer Based Acoustic Model For Low Latency Streaming Speech Recognition Yangyang Shi Yongqiang Wang Chunyang Wu Ching-Feng Yeh Julian Chan Frank Zhang Duc Le M. Seltzer 49 168 0 21 Oct 2020