Integrating Text Inputs For Training and Adapting RNN Transducer ASR
Models

Integrating Text Inputs For Training and Adapting RNN Transducer ASR Models

26 February 2022

Brian Kingsbury

Papers citing "Integrating Text Inputs For Training and Adapting RNN Transducer ASR Models"

16 / 16 papers shown

Title
A Non-autoregressive Model for Joint STT and TTS Vishal Sunder Brian Kingsbury G. Saon Samuel Thomas Slava Shechtman Hagai Aronowitz Hagai Aronowitz Eric Fosler-Lussier Luis A. Lastras 61 0 0 15 Jan 2025
Retrieval Augmented End-to-End Spoken Dialog Models Mingqiu Wang Izhak Shafran H. Soltau Wei Han Yuan Cao Dian Yu Laurent El Shafey RALM AuLLM 22 11 0 02 Feb 2024
Improving Large-scale Deep Biasing with Phoneme Features and Text-only Data in Streaming Transducer Jin Qiu Lu Huang Boyu Li Jun Zhang Lu Lu Zejun Ma 21 3 0 15 Nov 2023
SALM: Speech-augmented Language Model with In-context Learning for Speech Recognition and Translation Zhehuai Chen He Huang A. Andrusenko Oleksii Hrinchuk Krishna C. Puvvada Jason Chun Lok Li Subhankar Ghosh Jagadeesh Balam Boris Ginsburg LRM 21 49 0 13 Oct 2023
Improving End-to-End Speech Processing by Efficient Text Data Utilization with Latent Synthesis Jianqiao Lu Wenyong Huang Nianzu Zheng Xingshan Zeng Y. Yeung Xiao Chen SyDa 24 1 0 09 Oct 2023
Cross-Modal Multi-Tasking for Speech-to-Text Translation via Hard Parameter Sharing B. Grimstad Xuankai Chang Antonios Anastasopoulos Yuya Fujita Shinji Watanabe 23 2 0 27 Sep 2023
End-to-End Open Vocabulary Keyword Search With Multilingual Neural Representations Bolaji Yusuf J. Černocký Murat Saraclar 46 2 0 15 Aug 2023
Text Injection for Capitalization and Turn-Taking Prediction in Speech Models Shaan Bijwadia Shuo-yiin Chang Weiran Wang Zhong Meng Hao Zhang Tara N. Sainath 24 1 0 14 Aug 2023
Using Text Injection to Improve Recognition of Personal Identifiers in Speech Yochai Blau Rohan Agrawal Lior Madmony Gary Wang Andrew Rosenberg Zhehuai Chen Zorik Gekhman Genady Beryozkin Parisa Haghani Bhuvana Ramabhadran 34 3 0 14 Aug 2023
Speech-to-Text Adapter and Speech-to-Entity Retriever Augmented LLMs for Speech Understanding Mingqiu Wang Izhak Shafran H. Soltau Wei Han Yuan Cao Dian Yu Laurent El Shafey RALM AuLLM 13 9 0 08 Jun 2023
Text-only Domain Adaptation using Unified Speech-Text Representation in Transducer Lu Huang B. Li Jun Zhang Lu Lu Zejun Ma 29 2 0 07 Jun 2023
Understanding Shared Speech-Text Representations Gary Wang Kyle Kastner Ankur Bapna Zhehuai Chen Andrew Rosenberg Bhuvana Ramabhadran Yu Zhang AuLLM 69 7 0 27 Apr 2023
On-the-fly Text Retrieval for End-to-End ASR Adaptation Bolaji Yusuf Aditya Gourav Ankur Gandhe I. Bulyko KELM RALM 35 4 0 20 Mar 2023
Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages Yu Zhang Wei Han James Qin Yongqiang Wang Ankur Bapna ... Pedro J. Moreno Chung-Cheng Chiu J. Schalkwyk Franccoise Beaufays Yonghui Wu VLM 79 253 0 02 Mar 2023
Text-only domain adaptation for end-to-end ASR using integrated text-to-mel-spectrogram generator Vladimir Bataev Roman Korostik Evgeny Shabalin Vitaly Lavrukhin Boris Ginsburg VLM 30 14 0 27 Feb 2023
Oracle Teacher: Leveraging Target Information for Better Knowledge Distillation of CTC Models J. Yoon H. Kim Hyeon Seung Lee Sunghwan Ahn N. Kim 28 1 0 05 Nov 2021