Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization

16 June 2022

Papers citing "Accelerating Inference and Language Model Fusion of Recurrent Neural Network Transducers via End-to-End 4-bit Quantization"

2 / 2 papers shown

Title
Alignment-Free Training for Transducer-based Multi-Talker ASR Takafumi Moriya Shota Horiguchi Marc Delcroix Ryo Masumura Takanori Ashihara Hiroshi Sato Kohei Matsuura Masato Mimura 31 1 0 30 Sep 2024
A Model for Every User and Budget: Label-Free and Personalized Mixed-Precision Quantization Edward Fish Umberto Michieli Mete Ozay MQ 22 4 0 24 Jul 2023