Multi-target DoA Estimation with an Audio-visual Fusion Mechanism

Multi-target DoA Estimation with an Audio-visual Fusion Mechanism

13 May 2021

Xinyuan Qian

Maulik C. Madhavi

Jiadong Wang

Haizhou Li

Papers citing "Multi-target DoA Estimation with an Audio-visual Fusion Mechanism"

8 / 8 papers shown

Title
Calibration of Multiple Asynchronous Microphone Arrays using Hybrid TDOA Chengjie Zhang Wenda Pan Xinyang Han He Kong 40 0 0 10 Feb 2025
AV-PedAware: Self-Supervised Audio-Visual Fusion for Dynamic Pedestrian Awareness Yizhuo Yang Shenghai Yuan Muqing Cao Jianfei Yang Lihua Xie 51 7 0 11 Nov 2024
Audio-Visual Speaker Tracking: Progress, Challenges, and Future Directions Jinzheng Zhao Yong-mei Xu Xinyuan Qian Davide Berghi Peipei Wu Meng Cui Jianyuan Sun Philip J. B. Jackson Wenwu Wang BDL 37 7 0 23 Oct 2023
Target Active Speaker Detection with Audio-visual Cues Yiding Jiang Ruijie Tao Zexu Pan Haizhou Li 20 16 0 22 May 2023
Deep Learning Based Audio-Visual Multi-Speaker DOA Estimation Using Permutation-Free Loss Function Qing Wang Hang Chen Yannan Jiang Zhe Wang Yuyang Wang Jun Du Chin-Hui Lee 14 4 0 26 Oct 2022
Deep Learning Based Stage-wise Two-dimensional Speaker Localization with Large Ad-hoc Microphone Arrays Shupei Liu Linfeng Feng Yijun Gong Chengdong Liang Chen Zhang Xiao-Lei Zhang Xuelong Li 16 3 0 19 Oct 2022
A Hybrid Continuity Loss to Reduce Over-Suppression for Time-domain Target Speaker Extraction Zexu Pan Meng Ge Haizhou Li 18 17 0 31 Mar 2022
Speaker Extraction with Co-Speech Gestures Cue Zexu Pan Xinyuan Qian Haizhou Li SLR 21 26 0 31 Mar 2022