GPU-accelerated Guided Source Separation for Meeting Transcription

10 December 2022

Sanjeev Khudanpur

Papers citing "GPU-accelerated Guided Source Separation for Meeting Transcription"

23 / 23 papers shown

Title
STCON System for the CHiME-8 Challenge Anton Mitrofanov Tatiana Prisyach Tatiana Timofeeva Sergei Novoselov M. Korenevsky ... Dmitriy Miroshnichenko Nikita Mamaev Ilya Odegov Olga Rudnitskaya A. Romanenko 26 1 0 17 Oct 2024
Incorporating Spatial Cues in Modular Speaker Diarization for Multi-channel Multi-party Meetings Ruoyu Wang Shutong Niu Gaobin Yang Jun Du Shuangqing Qian Tian Gao Jia Pan 36 1 0 25 Sep 2024
The CHiME-8 DASR Challenge for Generalizable and Array Agnostic Distant Automatic Speech Recognition and Diarization Samuele Cornell Taejin Park Steve Huang Christoph Boeddeker Xuankai Chang Matthew Maciejewski Matthew Wiesner Paola García Shinji Watanabe 39 9 0 23 Jul 2024
Neural Blind Source Separation and Diarization for Distant Speech Recognition Yoshiaki Bando Tomohiko Nakamura Shinji Watanabe BDL 34 5 0 12 Jun 2024
ASoBO: Attentive Beamformer Selection for Distant Speaker Diarization in Meetings Théo Mariotte Anthony Larcher Silvio Montrésor Jean-Hugh Thomas 32 0 0 05 Jun 2024
Cross-Talk Reduction Zhong-Qiu Wang Anurag Kumar Shinji Watanabe 29 2 0 30 May 2024
The RoyalFlush Automatic Speech Diarization and Recognition System for In-Car Multi-Channel Automatic Speech Recognition Challenge Jingguang Tian Shuaishuai Ye Shunfei Chen Yang Xiang Zhaohui Yin Xinhui Hu Xinkang Xu 30 0 0 09 May 2024
A Study of Dropout-Induced Modality Bias on Robustness to Missing Video Frames for Audio-Visual Speech Recognition Yusheng Dai Hang Chen Jun Du Ruoyu Wang Shihao Chen Jie Ma Haotian Wang Chin-Hui Lee 43 4 0 07 Mar 2024
Channel-Combination Algorithms for Robust Distant Voice Activity and Overlapped Speech Detection Théo Mariotte Anthony Larcher Silvio Montrésor Jean-Hugh Thomas 27 2 0 13 Feb 2024
On Speaker Attribution with SURT Desh Raj Matthew Wiesner Matthew Maciejewski Leibny Paola García-Perera Daniel Povey Sanjeev Khudanpur 32 3 0 28 Jan 2024
An audio-quality-based multi-strategy approach for target speaker extraction in the MISP 2023 Challenge Ru Han Xiaopeng Yan Weiming Xu Pengcheng Guo Jiayao Sun He Wang Quan Lu Ning Jiang Lei Xie 30 1 0 08 Jan 2024
The NUS-HLT System for ICASSP2024 ICMC-ASR Grand Challenge Meng Ge Yizhou Peng Yidi Jiang Jingru Lin Junyi Ao Mehmet Sinan Yildirim Shuai Wang Haizhou Li Mengling Feng 18 0 0 26 Dec 2023
DiaPer: End-to-End Neural Diarization with Perceiver-Based Attractors Federico Landini Mireia Díez Themos Stafylakis Lukávs Burget 31 11 0 07 Dec 2023
Powerset multi-class cross entropy loss for neural speaker diarization Alexis Plaquet H. Bredin 109 91 0 19 Oct 2023
BUT CHiME-7 system description M. Karafiát Karel Veselý Igor Szöke Ladislav Mošner Karel Beneš Marcin Witkowski Germán Barchi L. Pepino 27 1 0 18 Oct 2023
The Multimodal Information Based Speech Processing (MISP) 2023 Challenge: Audio-Visual Target Speaker Extraction Shilong Wu Chenxi Wang Hang Chen Yusheng Dai Chenyue Zhang ... Sabato Marco Siniscalchi O. Scharenborg Zhong-Qiu Wang Jia Pan Jianqing Gao 20 9 0 15 Sep 2023
The USTC-NERCSLIP Systems for the CHiME-7 DASR Challenge Ruoyu Wang Maokui He Jun Du Hengshun Zhou Shutong Niu ... Mengzhi Wang Genshun Wan Jia Pan Jianqing Gao Chin-Hui Lee 30 12 0 28 Aug 2023
The CHiME-7 DASR Challenge: Distant Meeting Transcription with Multiple Devices in Diverse Scenarios Samuele Cornell Matthew Wiesner Shinji Watanabe Desh Raj Xuankai Chang ... Matthew Maciejewski Yoshiki Masuyama Zhong-Qiu Wang S. Squartini Sanjeev Khudanpur 24 51 0 23 Jun 2023
SURT 2.0: Advances in Transducer-based Multi-talker Speech Recognition Desh Raj Daniel Povey Sanjeev Khudanpur VLM 26 9 0 18 Jun 2023
TS-SEP: Joint Diarization and Separation Conditioned on Estimated Speaker Embeddings Christoph Boeddeker Aswin Shanmugam Subramanian G. Wichern Reinhold Haeb-Umbach Jonathan Le Roux 29 23 0 07 Mar 2023
Fast and parallel decoding for transducer Wei Kang Liyong Guo Fangjun Kuang Long Lin Mingshuang Luo Zengwei Yao Xiaoyu Yang Piotr Żelasko Daniel Povey AI4TS 19 15 0 31 Oct 2022
Bayesian HMM clustering of x-vector sequences (VBx) in speaker diarization: theory, implementation and analysis on standard tasks Federico Landini Jan Profant Mireia Díez L. Burget 216 199 0 29 Dec 2020
Auto-Tuning Spectral Clustering for Speaker Diarization Using Normalized Maximum Eigengap Tae Jin Park Kyu Jeong Han Manoj Kumar Shrikanth Narayanan 128 116 0 05 Mar 2020