Sequence to Multi-Sequence Learning via Conditional Chain Mapping for
Mixture Signals

Sequence to Multi-Sequence Learning via Conditional Chain Mapping for Mixture Signals

25 June 2020

Shinji Watanabe

Jiaming Xu

Bo Xu

Lei Xie

ArXiv (abs)PDF HTML

Papers citing "Sequence to Multi-Sequence Learning via Conditional Chain Mapping for Mixture Signals"

17 / 17 papers shown

Title
SC-SOT: Conditioning the Decoder on Diarized Speaker Information for End-to-End Overlapped Speech Recognition Yuta Hirano Sakriani Sakti 7 0 0 15 Jun 2025
Boosting Unknown-number Speaker Separation with Transformer Decoder-based Attractor Younglo Lee Shukjae Choi Byeonghak Kim Zhong-Qiu Wang Shinji Watanabe MoE 56 10 0 23 Jan 2024
On Robustness to Missing Video for Audiovisual Speech Recognition Oscar Chang Otavio Braga H. Liao Dmitriy Serdyuk Olivier Siohan 99 11 0 13 Dec 2023
A Single Speech Enhancement Model Unifying Dereverberation, Denoising, Speaker Counting, Separation, and Extraction Kohei Saijo Wangyou Zhang Zhong-Qiu Wang Shinji Watanabe Tetsunori Kobayashi Tetsuji Ogawa VLM 70 6 0 12 Oct 2023
BA-SOT: Boundary-Aware Serialized Output Training for Multi-Talker ASR Yuhao Liang Fan Yu Yangze Li Pengcheng Guo Shiliang Zhang Qian Chen Linfu Xie 83 9 0 23 May 2023
Online Neural Diarization of Unlimited Numbers of Speakers Using Global and Local Attractors Shota Horiguchi Shinji Watanabe Leibny Paola García-Perera Yuki Takashima Yohei Kawaguchi 98 24 0 06 Jun 2022
EEND-SS: Joint End-to-End Neural Speaker Diarization and Speech Separation for Flexible Number of Speakers Soumi Maiti Yushi Ueda Shinji Watanabe Chunlei Zhang Meng Yu Shi-Xiong Zhang Yong-mei Xu 94 33 0 31 Mar 2022
Extended Graph Temporal Classification for Multi-Speaker End-to-End ASR Xuankai Chang Niko Moritz Takaaki Hori Shinji Watanabe Jonathan Le Roux 86 6 0 01 Mar 2022
L-SpEx: Localized Target Speaker Extraction Meng Ge Chenglin Xu Longbiao Wang Eng Siong Chng Jianwu Dang Haizhou Li 52 24 0 21 Feb 2022
Acoustic Event Detection with Classifier Chains Tatsuya Komatsu Shinji Watanabe Koichi Miyazaki Tomoki Hayashi 49 7 0 17 Feb 2022
Summary On The ICASSP 2022 Multi-Channel Multi-Party Meeting Transcription Grand Challenge Fan Yu Shiliang Zhang Pengcheng Guo Yihui Fu Zhihao Du ... Kong Aik Lee Zhijie Yan B. Ma Xin Xu Hui Bu 59 28 0 08 Feb 2022
Multi-Speaker ASR Combining Non-Autoregressive Conformer CTC and Conditional Speaker Chain Pengcheng Guo Xuankai Chang Shinji Watanabe Lei Xie 48 19 0 16 Jun 2021
End-to-End Speaker Diarization Conditioned on Speech Activity and Overlap Detection Yuki Takashima Yusuke Fujita Shinji Watanabe Shota Horiguchi Leibny Paola García-Perera Kenji Nagamatsu 60 26 0 08 Jun 2021
Boundary and Context Aware Training for CIF-based Non-Autoregressive End-to-end ASR Fan Yu Haoneng Luo Pengcheng Guo Yuhao Liang Zhuoyuan Yao Lei Xie Yingying Gao Leijing Hou Shilei Zhang 25 11 0 10 Apr 2021
Deep Learning based Multi-Source Localization with Source Splitting and its Effectiveness in Multi-Talker Speech Recognition Aswin Shanmugam Subramanian Chao Weng Shinji Watanabe Meng Yu Dong Yu 115 80 0 16 Feb 2021
Single channel voice separation for unknown number of speakers under reverberant and noisy settings Shlomo E. Chazan Lior Wolf Eliya Nachmani Yossi Adi 68 29 0 04 Nov 2020
Cascaded encoders for unifying streaming and non-streaming ASR A. Narayanan Tara N. Sainath Ruoming Pang Jiahui Yu Chung-Cheng Chiu Rohit Prabhavalkar Ehsan Variani Trevor Strohman AuLLM 128 86 0 27 Oct 2020