Fully Supervised Speaker Diarization

10 October 2018

Papers citing "Fully Supervised Speaker Diarization"

44 / 44 papers shown

Title
Systematic Evaluation of Online Speaker Diarization Systems Regarding their Latency Roman Aperdannier Sigurd Schacht Alexander Piazza 44 0 0 05 Jul 2024
LLM-based speaker diarization correction: A generalizable approach Georgios Efstathiadis Vijay Yadav Anzar Abbas 45 3 0 07 Jun 2024
End-to-end Online Speaker Diarization with Target Speaker Tracking Weiqing Wang Ming Li 39 5 0 12 Oct 2023
Frame-wise streaming end-to-end speaker diarization with non-autoregressive self-attention-based attractors Di Liang Nian Shao Xiaofei Li 33 4 0 25 Sep 2023
Lexical Speaker Error Correction: Leveraging Language Models for Speaker Diarization Error Correction Rohit Paturi S. Srinivasan Xiang Li 26 13 0 15 Jun 2023
An Experimental Review of Speaker Diarization methods with application to Two-Speaker Conversational Telephone Speech recordings L. Serafini Samuele Cornell Giovanni Morrone Enrico Zovato Alessio Brutti S. Squartini 47 9 0 29 May 2023
WhisperX: Time-Accurate Speech Transcription of Long-Form Audio Max Bain Jaesung Huh Tengda Han Andrew Zisserman 45 210 0 01 Mar 2023
In search of strong embedding extractors for speaker diarisation Jee-weon Jung Hee-Soo Heo Bong-Jin Lee Jaesung Huh A. Brown Youngki Kwon Shinji Watanabe Joon Son Chung 44 16 0 26 Oct 2022
Highly Efficient Real-Time Streaming and Fully On-Device Speaker Diarization with Multi-Stage Clustering Quan Wang Yiling Huang Han Lu Guanlong Zhao Ignacio López Moreno 34 11 0 25 Oct 2022
Mutual Learning of Single- and Multi-Channel End-to-End Neural Diarization Shota Horiguchi Yuki Takashima Shinji Watanabe Leibny Paola García-Perera 36 2 0 07 Oct 2022
Robust Acoustic Domain Identification with its Application to Speaker Diarization Kishore Kumar A Shefali Waldekar Md. Sahidullah G. Saha 24 0 0 05 Aug 2022
Sequence-level Speaker Change Detection with Difference-based Continuous Integrate-and-fire Zhiyun Fan Linhao Dong Meng Cai Zejun Ma Bo Xu 36 4 0 27 Jun 2022
Online Neural Diarization of Unlimited Numbers of Speakers Using Global and Local Attractors Shota Horiguchi Shinji Watanabe Leibny Paola García-Perera Yuki Takashima Y. Kawaguchi 39 23 0 06 Jun 2022
Self-supervised Speaker Diarization Yehoshua Dissen Felix Kreuk Joseph Keshet 13 4 0 08 Apr 2022
Generation of Speaker Representations Using Heterogeneous Training Batch Assembly Yu-Huai Peng Hung-Shin Lee Pin-Tuan Huang Hsin-Min Wang 21 0 0 30 Mar 2022
Tight integration of neural- and clustering-based diarization through deep unfolding of infinite Gaussian mixture model K. Kinoshita Marc Delcroix Tomoharu Iwata BDL 25 19 0 14 Feb 2022
Low-Latency Online Speaker Diarization with Graph-Based Label Generation Yucong Zhang Qinjian Lin Weiqing Wang Lin Yang Xuyang Wang Junjie Wang Ming Li 22 10 0 27 Nov 2021
Turn-to-Diarize: Online Speaker Diarization Constrained by Transformer Transducer Speaker Turn Detection Wei Xia Han Lu Quan Wang Anshuman Tripathi Yiling Huang Ignacio López Moreno Hasim Sak 46 51 0 23 Sep 2021
Self-Supervised Metric Learning With Graph Clustering For Speaker Diarization Prachi Singh Sriram Ganapathy SSL 31 7 0 14 Sep 2021
Using Large Pre-Trained Models with Cross-Modal Attention for Multi-Modal Emotion Recognition Krishna D N Freshworks 26 11 0 22 Aug 2021
A Real-time Speaker Diarization System Based on Spatial Spectrum Siqi Zheng Weilong Huang Xianliang Wang Hongbin Suo Jinwei Feng Zhijie Yan 11 24 0 20 Jul 2021
Encoder-Decoder Based Attractors for End-to-End Neural Diarization Shota Horiguchi Yusuke Fujita Shinji Watanabe Yawen Xue Leibny Paola García-Perera 37 64 0 20 Jun 2021
End-to-End Diarization for Variable Number of Speakers with Local-Global Networks and Discriminative Speaker Embeddings Soumi Maiti Hakan Erdogan K. Wilson Scott Wisdom Shinji Watanabe J. Hershey 27 21 0 05 May 2021
A Review of Speaker Diarization: Recent Advances with Deep Learning Tae Jin Park Naoyuki Kanda Dimitrios Dimitriadis Kyu Jeong Han Shinji Watanabe Shrikanth Narayanan VLM 274 327 0 24 Jan 2021
MAAS: Multi-modal Assignation for Active Speaker Detection Juan Carlos León Alcázar Fabian Caba Heilbron Ali K. Thabet Guohao Li 65 51 0 11 Jan 2021
Bayesian HMM clustering of x-vector sequences (VBx) in speaker diarization: theory, implementation and analysis on standard tasks Federico Landini Jan Profant Mireia Díez L. Burget 216 199 0 29 Dec 2020
Block-Online Guided Source Separation Shota Horiguchi Yusuke Fujita Kenji Nagamatsu 25 4 0 16 Nov 2020
BW-EDA-EEND: Streaming End-to-End Neural Speaker Diarization for a Variable Number of Speakers Eunjung Han Chul Lee A. Stolcke 24 42 0 05 Nov 2020
Combination of Deep Speaker Embeddings for Diarisation Guangzhi Sun Chao Zhang P. Woodland 25 20 0 22 Oct 2020
The HUAWEI Speaker Diarisation System for the VoxCeleb Speaker Diarisation Challenge Renyu Wang Ruilin Tong Y. Yeung Xiao Chen 6 1 0 22 Oct 2020
asya: Mindful verbal communication using deep learning Ē. Urtāns Ariel Tabaks VLM 33 1 0 20 Aug 2020
DNN Speaker Tracking with Embeddings C. Castillo-Sanchez Leibny Paola García-Perera A. Martín-González 16 0 0 13 Jul 2020
Speaker diarization with session-level speaker embedding refinement using graph neural networks Jixuan Wang Xiong Xiao Jian Wu Ranjani Ramamurthy Frank Rudzicz M. Brudno 17 25 0 22 May 2020
End-to-End Speaker Diarization for an Unknown Number of Speakers with Encoder-Decoder Based Attractors Shota Horiguchi Yusuke Fujita Shinji Watanabe Yawen Xue Kenji Nagamatsu 37 186 0 20 May 2020
Active Speakers in Context Juan Carlos León Alcázar Fabian Caba Heilbron Long Mai Federico Perazzi Joon-Young Lee Pablo Arbelaez Guohao Li 32 61 0 20 May 2020
Speech Recognition and Multi-Speaker Diarization of Long Conversations H. H. Mao Shuyang Li Julian McAuley G. Cottrell VLM 22 40 0 16 May 2020
End-to-End Neural Diarization: Reformulating Speaker Diarization as Simple Multi-label Classification Yusuke Fujita Shinji Watanabe Shota Horiguchi Yawen Xue Kenji Nagamatsu 14 49 0 24 Feb 2020
Speaker diarization using latent space clustering in generative adversarial network Monisankha Pal Manoj Kumar Raghuveer Peri Tae Jin Park So Hyun Kim C. Lord Somer Bishop Shrikanth Narayanan 27 20 0 24 Oct 2019
Discriminative Neural Clustering for Speaker Diarisation Qiujia Li Florian Kreyssig Chao Zhang P. Woodland 11 44 0 22 Oct 2019
End-to-End Neural Speaker Diarization with Self-attention Yusuke Fujita Naoyuki Kanda Shota Horiguchi Yawen Xue Kenji Nagamatsu Shinji Watanabe 190 237 0 13 Sep 2019
Joint Speech Recognition and Speaker Diarization via Sequence Transduction Laurent El Shafey H. Soltau Izhak Shafran 33 99 0 09 Jul 2019
Direct speech-to-speech translation with a sequence-to-sequence model Ye Jia Ron J. Weiss Fadi Biadsy Wolfgang Macherey Melvin Johnson Zhiwen Chen Yonghui Wu 21 223 0 12 Apr 2019
VoxCeleb2: Deep Speaker Recognition Joon Son Chung Arsha Nagrani Andrew Zisserman 266 2,238 0 14 Jun 2018
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis Ye Jia Yu Zhang Ron J. Weiss Quan Wang Jonathan Shen ... Zhiwen Chen Patrick Nguyen Ruoming Pang Ignacio López Moreno Yonghui Wu 207 820 0 12 Jun 2018