Improving speaker discrimination of target speech extraction with time-domain SpeakerBeam

23 January 2020

Papers citing "Improving speaker discrimination of target speech extraction with time-domain SpeakerBeam"

32 / 32 papers shown

Title
Unified Architecture and Unsupervised Speech Disentanglement for Speaker Embedding-Free Enrollment in Personalized Speech Enhancement Ziling Huang Haixin Guan Yanhua Long 4 0 0 18 May 2025
TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models Junyi Peng Takanori Ashihara Marc Delcroix Tsubasa Ochiai Oldrich Plchot Shoko Araki J. Černocký ELM 29 0 0 10 May 2025
Listen to Extract: Onset-Prompted Target Speaker Extraction Pengjie Shen Kangrui Chen Shulin He Pengru Chen Shuqi Yuan He Kong Xueliang Zhang Zehao Wang 53 0 0 08 May 2025
End-to-End Multi-Microphone Speaker Extraction Using Relative Transfer Functions Aviad Eisenberg Sharon Gannot Shlomo E. Chazan 48 0 0 10 Feb 2025
USEF-TSE: Universal Speaker Embedding Free Target Speaker Extraction Bang Zeng Ming Li 37 2 0 04 Sep 2024
Beamformer-Guided Target Speaker Extraction Mohamed Elminshawi Srikanth Raj Chetupalli Emanuel Habets 21 7 0 15 Mar 2023
A two-stage speaker extraction algorithm under adverse acoustic conditions using a single-microphone Aviad Eisenberg Sharon Gannot Shlomo E. Chazan 24 2 0 13 Mar 2023
Improving Target Speaker Extraction with Sparse LDA-transformed Speaker Embeddings Kai Liu Xucheng Wan Z.C. Du Huan Zhou VLM 27 1 0 16 Jan 2023
Breaking the trade-off in personalized speech enhancement with cross-task knowledge distillation H. Taherian Sefik Emre Eskimez Takuya Yoshioka 24 1 0 05 Nov 2022
Real-Time Joint Personalized Speech Enhancement and Acoustic Echo Cancellation Sefik Emre Eskimez Takuya Yoshioka Alex Ju M. Tang Tanel Pärnamaa Huaming Wang 27 7 0 04 Nov 2022
Hierarchical speaker representation for target speaker extraction Shulin He Huaiwen Zhang Wei Rao Kanghao Zhang Yukai Ju Yang-Rui Yang Xueliang Zhang 37 3 0 28 Oct 2022
Deformable Temporal Convolutional Networks for Monaural Noisy Reverberant Speech Separation William Ravenscroft Stefan Goetze Thomas Hain 33 11 0 27 Oct 2022
Streaming Target-Speaker ASR with Neural Transducer Takafumi Moriya Hiroshi Sato Tsubasa Ochiai Marc Delcroix T. Shinozaki 31 21 0 09 Sep 2022
Multi-channel target speech enhancement based on ERB-scaled spatial coherence features Yicheng Hsu Yonghan Lee M. Bai 28 1 0 17 Jul 2022
Semi-supervised Time Domain Target Speaker Extraction with Attention Zhepei Wang Ritwik Giri Shrikant Venkataramani Umut Isik J. Valin Paris Smaragdis Mike Goodwin A. Krishnaswamy 24 7 0 18 Jun 2022
Speaker Reinforcement Using Target Source Extraction for Robust Automatic Speech Recognition Catalin Zorila R. Doddipatla 24 11 0 09 May 2022
Listen only to me! How well can target speech extraction handle false alarms? Marc Delcroix K. Kinoshita Tsubasa Ochiai Kateřina Žmolíková Hiroshi Sato Tomohiro Nakatani 34 15 0 11 Apr 2022
SoundBeam: Target sound extraction conditioned on sound-class labels and enrollment clues for increased performance and continuous learning Marc Delcroix Jorge Bennasar Vázquez Tsubasa Ochiai K. Kinoshita Yasunori Ohishi S. Araki VLM 22 32 0 08 Apr 2022
Target Confusion in End-to-end Speaker Extraction: Analysis and Approaches Zifeng Zhao Dongchao Yang Rongzhi Gu Haoran Zhang Yuexian Zou 23 16 0 04 Apr 2022
A Hybrid Continuity Loss to Reduce Over-Suppression for Time-domain Target Speaker Extraction Zexu Pan Meng Ge Haizhou Li 21 17 0 31 Mar 2022
Speaker Extraction with Co-Speech Gestures Cue Zexu Pan Xinyuan Qian Haizhou Li SLR 21 27 0 31 Mar 2022
Single microphone speaker extraction using unified time-frequency Siamese-Unet Aviad Eisenberg Sharon Gannot Shlomo E. Chazan 30 3 0 06 Mar 2022
Learning-based personal speech enhancement for teleconferencing by exploiting spatial-spectral features Yicheng Hsu Yonghan Lee M. Bai 22 10 0 10 Dec 2021
Target Speech Extraction: Independent Vector Extraction Guided by Supervised Speaker Identification J. Málek Jakub Janský Zbyněk Koldovský Tomás Kounovský Jaroslav Cmejla J. Zdánský 25 10 0 05 Nov 2021
One model to enhance them all: array geometry agnostic multi-channel personalized speech enhancement H. Taherian Sefik Emre Eskimez Takuya Yoshioka Huaming Wang Zhuo Chen Xuedong Huang 30 21 0 20 Oct 2021
USEV: Universal Speaker Extraction with Visual Cue Zexu Pan Meng Ge Haizhou Li 34 41 0 30 Sep 2021
Should We Always Separate?: Switching Between Enhanced and Observed Signals for Overlapping Speech Recognition Hiroshi Sato Tsubasa Ochiai Marc Delcroix K. Kinoshita Takafumi Moriya Naoyuki Kamo 27 23 0 02 Jun 2021
Attention-based scaling adaptation for target speech extraction Jiangyu Han Wei Rao Yanhua Long Jiaen Liang 19 9 0 19 Oct 2020
Listen to What You Want: Neural Network-based Universal Sound Selector Tsubasa Ochiai Marc Delcroix Yuma Koizumi Hiroaki Ito K. Kinoshita S. Araki 19 61 0 10 Jun 2020
SpEx+: A Complete Time Domain Speaker Extraction Network Meng Ge Chenglin Xu Longbiao Wang Chng Eng Siong J. Dang Haizhou Li 27 144 0 10 May 2020
Tackling real noisy reverberant meetings with all-neural source separation, counting, and diarization system K. Kinoshita Marc Delcroix S. Araki Tomohiro Nakatani 197 30 0 09 Mar 2020
Deep Extractor Network for Target Speaker Recovery From Single Channel Speech Mixtures Jun Wang Jie Chen Dan Su Lianwu Chen Meng Yu Y. Qian Dong Yu 46 90 0 24 Jul 2018