Bridging Speech and Textual Pre-trained Models with Unsupervised ASR

Bridging Speech and Textual Pre-trained Models with Unsupervised ASR

6 November 2022

Jiatong Shi

Leibny Paola García-Perera

Shinji Watanabe

Papers citing "Bridging Speech and Textual Pre-trained Models with Unsupervised ASR"

8 / 8 papers shown

Title
Muskits-ESPnet: A Comprehensive Toolkit for Singing Voice Synthesis in New Paradigm Yuning Wu Jiatong Shi Yifeng Yu Yuxun Tang Tao Qian Yueqian Lin Jionghao Han Xinyi Bai Shinji Watanabe Qin Jin 29 3 0 11 Sep 2024
MMM: Multi-Layer Multi-Residual Multi-Stream Discrete Speech Representation from Self-supervised Learning Model Jiatong Shi Xutai Ma Hirofumi Inaguma Anna Y. Sun Shinji Watanabe 50 7 0 14 Jun 2024
SingOMD: Singing Oriented Multi-resolution Discrete Representation Construction from Speech Models Yuxun Tang Yuning Wu Jiatong Shi Qin Jin 52 5 0 13 Jun 2024
HuBERTopic: Enhancing Semantic Representation of HuBERT through Self-supervision Utilizing Topic Model Takashi Maekaku Jiatong Shi Xuankai Chang Yuya Fujita Shinji Watanabe 23 1 0 06 Oct 2023
Multi-resolution HuBERT: Multi-resolution Speech Self-Supervised Learning with Masked Unit Prediction Jiatong Shi H. Inaguma Xutai Ma Ilia Kulikov Anna Y. Sun 43 24 0 04 Oct 2023
Exploration on HuBERT with Multiple Resolutions Jiatong Shi Yun Tang H. Inaguma Hongyu Gong J. Pino Shinji Watanabe 30 9 0 01 Jun 2023
Introducing Semantics into Speech Encoders Derek Xu Shuyan Dong Changhan Wang Suyoun Kim Zhaojiang Lin ... Alexei Baevski Guan-Ting Lin Hung-yi Lee Yizhou Sun Wei Wang SSL 25 3 0 15 Nov 2022
T5lephone: Bridging Speech and Text Self-supervised Models for Spoken Language Understanding via Phoneme level T5 Chan-Jan Hsu Ho-Lam Chung Hung-yi Lee Yu Tsao 17 6 0 01 Nov 2022