End-to-End Neural Speaker Diarization with Permutation-Free Objectives

End-to-End Neural Speaker Diarization with Permutation-Free Objectives

12 September 2019

Shota Horiguchi

Kenji Nagamatsu

Shinji Watanabe

Papers citing "End-to-End Neural Speaker Diarization with Permutation-Free Objectives"

12 / 12 papers shown

Title
USED: Universal Speaker Extraction and Diarization Junyi Ao Mehmet Sinan Yildirim Ruijie Tao Mengyao Ge Shuai Wang Yan-min Qian Haizhou Li 31 5 0 17 Jan 2025
Language-based Audio Moment Retrieval Hokuto Munakata Taichi Nishimura Shota Nakada Tatsuya Komatsu 22 1 0 24 Sep 2024
LLM-based speaker diarization correction: A generalizable approach Georgios Efstathiadis Vijay Yadav Anzar Abbas 29 3 0 07 Jun 2024
A Large-Scale Evaluation of Speech Foundation Models Shu-Wen Yang Heng-Jui Chang Zili Huang Andy T. Liu Cheng-I Jeff Lai ... Kushal Lakhotia Shang-Wen Li Abdelrahman Mohamed Shinji Watanabe Hung-yi Lee 30 19 0 15 Apr 2024
Continuous Target Speech Extraction: Enhancing Personalized Diarization and Extraction on Complex Recordings He Zhao Hangting Chen Jianwei Yu Yuehai Wang 19 0 0 29 Jan 2024
Fine-Tuned Self-Supervised Speech Representations for Language Diarization in Multilingual Code-Switched Speech Geoffrey T. Frost Emily Morris Joshua Jansen van Vüren T. Niesler 18 2 0 15 Dec 2023
End-to-end Online Speaker Diarization with Target Speaker Tracking Weiqing Wang Ming Li 6 5 0 12 Oct 2023
Multiset-Equivariant Set Prediction with Approximate Implicit Differentiation Yan Zhang David W. Zhang Simon Lacoste-Julien Gertjan J. Burghouts Cees G. M. Snoek BDL 24 20 0 23 Nov 2021
WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing Sanyuan Chen Chengyi Wang Zhengyang Chen Yu-Huan Wu Shujie Liu ... Yao Qian Jian Wu Micheal Zeng Xiangzhan Yu Furu Wei SSL 8 1,687 0 26 Oct 2021
Multi-Channel End-to-End Neural Diarization with Distributed Microphones Shota Horiguchi Yuki Takashima Leibny Paola García-Perera Shinji Watanabe Y. Kawaguchi 6 17 0 10 Oct 2021
End-to-End Diarization for Variable Number of Speakers with Local-Global Networks and Discriminative Speaker Embeddings Soumi Maiti Hakan Erdogan K. Wilson Scott Wisdom Shinji Watanabe J. Hershey 19 21 0 05 May 2021
Tackling real noisy reverberant meetings with all-neural source separation, counting, and diarization system K. Kinoshita Marc Delcroix S. Araki Tomohiro Nakatani 172 29 0 09 Mar 2020