Updated Corpora and Benchmarks for Long-Form Speech Recognition

IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 2023

26 September 2023

Papers citing "Updated Corpora and Benchmarks for Long-Form Speech Recognition"

4 / 4 papers shown

Efficiently Identifying Low-Quality Language Subsets in Multilingual Datasets: A Case Study on a Large-Scale Multilingual Audio Dataset

Farhan Samir

Vered Shwartz

157

05 Oct 2024

Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR

253

13 Sep 2024

Longer is (Not Necessarily) Stronger: Punctuated Long-Sequence Training for Enhanced Speech Recognition and TranslationSpoken Language Technology Workshop (SLT), 2024

Nithin Rao Koluguri

Travis M. Bartley

Hainan Xu

Oleksii Hrinchuk

Jagadeesh Balam

Boris Ginsburg

Georg Kucsko

323

09 Sep 2024

On the Effects of Heterogeneous Data Sources on Speech-to-Text Foundation Models

Jinchuan Tian

Yifan Peng

William Chen

Kwanghee Choi

Karen Livescu

Shinji Watanabe

192

13 Jun 2024