Typing to Listen at the Cocktail Party: Text-Guided Target Speaker
Extraction

Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction

11 October 2023

Kay Chen Tan

Papers citing "Typing to Listen at the Cocktail Party: Text-Guided Target Speaker Extraction"

8 / 8 papers shown

Title
Contextual Speech Extraction: Leveraging Textual History as an Implicit Cue for Target Speech Extraction Minsu Kim Rodrigo Mira Honglie Chen Stavros Petridis M. Pantic 56 0 0 13 Mar 2025
Target Speaker Extraction through Comparing Noisy Positive and Negative Audio Enrollments Shitong Xu Yiyuan Yang Niki Trigoni Andrew Markham 29 0 0 23 Feb 2025
Beyond Speaker Identity: Text Guided Target Speech Extraction Mingyue Huo Abhinav Jain Cong Phuoc Huynh Fanjie Kong Pichao Wang Zhu Liu Vimal Bhat 40 0 0 17 Jan 2025
Multi-View Subgraph Neural Networks: Self-Supervised Learning with Scarce Labeled Data Zhenzhong Wang Qingyuan Zeng Wanyu Lin Min Jiang Kay Chen Tan SSL 27 1 0 19 Apr 2024
Listen, Chat, and Edit: Text-Guided Soundscape Modification for Enhanced Auditory Experience Xilin Jiang Cong Han Yinghao Aaron Li N. Mesgarani KELM 21 4 0 06 Feb 2024
Separate Anything You Describe Xubo Liu Qiuqiang Kong Yan Zhao Haohe Liu Yiitan Yuan Yuzhuo Liu Rui Xia Yuxuan Wang Mark D. Plumbley Wenwu Wang VLM 17 43 0 09 Aug 2023
Make-An-Audio: Text-To-Audio Generation with Prompt-Enhanced Diffusion Models Rongjie Huang Jia-Bin Huang Dongchao Yang Yi Ren Luping Liu Mingze Li Zhenhui Ye Jinglin Liu Xiaoyue Yin Zhou Zhao DiffM 137 304 0 30 Jan 2023
Heterogeneous Target Speech Separation Hyunjae Cho Wonbin Jung Junhyeok Lee Paris Smaragdis Sanghyun Woo 31 26 0 07 Apr 2022