The CHiME-7 DASR Challenge: Distant Meeting Transcription with Multiple Devices in Diverse Scenarios

23 June 2023

Sanjeev Khudanpur

Papers citing "The CHiME-7 DASR Challenge: Distant Meeting Transcription with Multiple Devices in Diverse Scenarios"

32 / 32 papers shown

Title
How much to Dereverberate? Low-Latency Single-Channel Speech Enhancement in Distant Microphone Scenarios Satvik Venkatesh Philip Coleman Arthur Benilov Simon Brown Selim Sheta Frederic Roskam 25 0 0 02 May 2025
BERSting at the Screams: A Benchmark for Distanced, Emotional and Shouted Speech Recognition Paige Tuttosi Mantaj Dhillon Luna Sang Shane Eastwood Poorvi Bhatia Quang Minh Dinh Avni Kapoor Yewon Jin Angelica Lim 19 0 0 30 Apr 2025
From Speech to Summary: A Comprehensive Survey of Speech Summarization Fabian Retkowski Maike Züfle Andreas Sudmann Dinah Pfau Jan Niehues Alexander Waibel 39 0 0 10 Apr 2025
Microphone Array Signal Processing and Deep Learning for Speech Enhancement Reinhold Haeb-Umbach Tomohiro Nakatani Marc Delcroix Christoph Boeddeker Tsubasa Ochiai 35 0 0 13 Jan 2025
Joint Beamforming and Speaker-Attributed ASR for Real Distant-Microphone Meeting Transcription Can Cui Imran A. Sheikh Mostafa Sadeghi Emmanuel Vincent 19 0 0 29 Oct 2024
STCON System for the CHiME-8 Challenge Anton Mitrofanov Tatiana Prisyach Tatiana Timofeeva Sergei Novoselov M. Korenevsky ... Dmitriy Miroshnichenko Nikita Mamaev Ilya Odegov Olga Rudnitskaya A. Romanenko 26 1 0 17 Oct 2024
Incorporating Spatial Cues in Modular Speaker Diarization for Multi-channel Multi-party Meetings Ruoyu Wang Shutong Niu Gaobin Yang Jun Du Shuangqing Qian Tian Gao Jia Pan 31 1 0 25 Sep 2024
ESPnet-EZ: Python-only ESPnet for Easy Fine-tuning and Integration Masao Someki Kwanghee Choi Siddhant Arora William Chen Samuele Cornell Jionghao Han Yifan Peng Jiatong Shi Vaibhav Srivastav Shinji Watanabe VLM 28 0 0 14 Sep 2024
Sortformer: Seamless Integration of Speaker Diarization and ASR by Bridging Timestamps and Tokens Taejin Park Ivan Medennikov Kunal Dhawan Weiqing Wang He Huang Nithin Rao Koluguri Krishna C. Puvvada Jagadeesh Balam Boris Ginsburg 30 2 0 10 Sep 2024
Resource-Efficient Adaptation of Speech Foundation Models for Multi-Speaker ASR Weiqing Wang Kunal Dhawan Taejin Park Krishna C. Puvvada Ivan Medennikov Somshubra Majumdar He Huang Jagadeesh Balam Boris Ginsburg 28 1 0 02 Sep 2024
ProGRes: Prompted Generative Rescoring on ASR n-Best Ada Defne Tur Adel Moumen Mirco Ravanelli 26 1 0 30 Aug 2024
Generating Data with Text-to-Speech and Large-Language Models for Conversational Speech Recognition Samuele Cornell Jordan Darefsky Zhiyao Duan Shinji Watanabe SyDa 68 4 0 17 Aug 2024
ctPuLSE: Close-Talk, and Pseudo-Label Based Far-Field, Speech Enhancement Zhong-Qiu Wang 20 1 0 28 Jul 2024
The CHiME-8 DASR Challenge for Generalizable and Array Agnostic Distant Automatic Speech Recognition and Diarization Samuele Cornell Taejin Park Steve Huang Christoph Boeddeker Xuankai Chang Matthew Maciejewski Matthew Wiesner Paola García Shinji Watanabe 27 9 0 23 Jul 2024
Neural Blind Source Separation and Diarization for Distant Speech Recognition Yoshiaki Bando Tomohiko Nakamura Shinji Watanabe BDL 29 5 0 12 Jun 2024
LLM-based speaker diarization correction: A generalizable approach Georgios Efstathiadis Vijay Yadav Anzar Abbas 34 3 0 07 Jun 2024
Cross-Talk Reduction Zhong-Qiu Wang Anurag Kumar Shinji Watanabe 16 1 0 30 May 2024
Improving Speaker Assignment in Speaker-Attributed ASR for Real Meeting Applications Can Cui Imran Ahmad Sheikh Mostafa Sadeghi Emmanuel Vincent 20 2 0 11 Mar 2024
NOTSOFAR-1 Challenge: New Datasets, Baseline, and Tasks for Distant Meeting Transcription Alon Vinnikov Amir Ivry Aviv Hurvitz Igor Abramovski S. Koubi ... S. Sivasankaran Yifan Gong Min Tang Huaming Wang Eyal Krupka 24 20 0 16 Jan 2024
Automatic channel selection and spatial feature integration for multi-channel speech recognition across various array topologies Bingshen Mu Pengcheng Guo Dake Guo Pan Zhou Wei-Neng Chen Lei Xie 30 2 0 15 Dec 2023
EEND-DEMUX: End-to-End Neural Speaker Diarization via Demultiplexed Speaker Embeddings Sung Hwan Mun Mingrui Han Canyeong Moon Nam Soo Kim 17 1 0 11 Dec 2023
DiaPer: End-to-End Neural Diarization with Perceiver-Based Attractors Federico Landini Mireia Díez Themos Stafylakis Lukávs Burget 25 11 0 07 Dec 2023
The CHiME-7 Challenge: System Description and Performance of NeMo Team's DASR System T. Park He Huang Ante Jukić Kunal Dhawan Krishna C. Puvvada Nithin Rao Koluguri Nikolay Karpov A. Laptev Jagadeesh Balam Boris Ginsburg 6 6 0 18 Oct 2023
One model to rule them all ? Towards End-to-End Joint Speaker Diarization and Speech Recognition Samuele Cornell Jee-weon Jung Shinji Watanabe S. Squartini VLM 12 15 0 02 Oct 2023
NTT speaker diarization system for CHiME-7: multi-domain, multi-microphone End-to-end and vector clustering diarization Naohiro Tawara Marc Delcroix Atsushi Ando A. Ogawa 38 7 0 22 Sep 2023
Neural Speaker Diarization Using Memory-Aware Multi-Speaker Embedding with Sequence-to-Sequence Architecture Gaobin Yang Maokui He Shutong Niu Ruoyu Wang Yanyan Yue Shuangqing Qian Shilong Wu Jun Du Chin-Hui Lee 13 11 0 17 Sep 2023
Enhancing Speaker Diarization with Large Language Models: A Contextual Beam Search Approach T. Park Kunal Dhawan Nithin Rao Koluguri Jagadeesh Balam 25 15 0 11 Sep 2023
The USTC-NERCSLIP Systems for the CHiME-7 DASR Challenge Ruoyu Wang Maokui He Jun Du Hengshun Zhou Shutong Niu ... Mengzhi Wang Genshun Wan Jia Pan Jianqing Gao Chin-Hui Lee 20 12 0 28 Aug 2023
Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman Andrew Westbury Eugene Byrne Zachary Chavis Antonino Furnari ... Mike Zheng Shou Antonio Torralba Lorenzo Torresani Mingfei Yan Jitendra Malik EgoV 224 1,017 0 13 Oct 2021
pyannote.audio: neural building blocks for speaker diarization H. Bredin Ruiqing Yin Juan Manuel Coria G. Gelly Pavel Korshunov Marvin Lavechin D. Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill 183 310 0 04 Nov 2019
End-to-End Neural Speaker Diarization with Self-attention Yusuke Fujita Naoyuki Kanda Shota Horiguchi Yawen Xue Kenji Nagamatsu Shinji Watanabe 179 237 0 13 Sep 2019
Voices Obscured in Complex Environmental Settings (VOICES) corpus Colleen Richey Maria Artigas Zeb Armstrong C. Bartels H. Franco ... Julien van Hout Paul Gamble Jeff Hetherly Cory Stephenson Karl S. Ni 34 125 0 13 Apr 2018