TasNet: time-domain audio separation network for real-time, single-channel speech separation

1 November 2017

Papers citing "TasNet: time-domain audio separation network for real-time, single-channel speech separation"

50 / 97 papers shown

Title
Knowledge Distillation for Speech Denoising by Latent Representation Alignment with Cosine Distance Diep Luong Mikko Heikkinen K. Drossos Tuomas Virtanen 49 0 0 06 May 2025
A Comparative Study on Positional Encoding for Time-frequency Domain Dual-path Transformer-based Source Separation Models Kohei Saijo Tetsuji Ogawa 52 1 0 28 Apr 2025
DeepExtractor: Time-domain reconstruction of signals and glitches in gravitational wave data with deep learning Tom Dooney Harsh Narola Stefano Bromuri R. L. Curier C. Broeck Sarah Caudill D. Tan 67 0 0 30 Jan 2025
SoundSpring: Loss-Resilient Audio Transceiver with Dual-Functional Masked Language Modeling Shengshi Yao Jincheng Dai Xiaoqi Qin Sixian Wang Siye Wang K. Niu Ping Zhang 38 0 0 22 Jan 2025
Modulating State Space Model with SlowFast Framework for Compute-Efficient Ultra Low-Latency Speech Enhancement Longbiao Cheng Ashutosh Pandey Buye Xu T. Delbruck V. Ithapu Shih-Chii Liu 42 0 0 04 Nov 2024
DeWinder: Single-Channel Wind Noise Reduction using Ultrasound Sensing Kuang Yuan Shuo Han Swarun Kumar Bhiksha Raj 32 2 0 10 Sep 2024
USEF-TSE: Universal Speaker Embedding Free Target Speaker Extraction Bang Zeng Ming Li 37 2 0 04 Sep 2024
Advancing Spatio-Temporal Processing in Spiking Neural Networks through Adaptation Maximilian Baronig Romain Ferrand Silvester Sabathiel Robert Legenstein 48 3 0 14 Aug 2024
Weakly-supervised Audio Separation via Bi-modal Semantic Similarity Tanvir Mahmud Saeed Amizadeh K. Koishida Diana Marculescu AI4TS 16 2 0 02 Apr 2024
Real-time Low-latency Music Source Separation using Hybrid Spectrogram-TasNet Satvik Venkatesh Arthur Benilov Philip Coleman Frederic Roskam 37 5 0 27 Feb 2024
MossFormer2: Combining Transformer and RNN-Free Recurrent Network for Enhanced Time-Domain Monaural Speech Separation Shengkui Zhao Yukun Ma Chongjia Ni Chong Zhang Hao Wang Trung Hieu Nguyen Kun Zhou J. Yip Dianwen Ng Bin Ma 36 22 0 19 Dec 2023
Amphion: An Open-Source Audio, Music and Speech Generation Toolkit Xueyao Zhang Liumeng Xue Yicheng Gu Yuancheng Wang Haorui He ... Mingxuan Wang Jun Han Kai Chen Haizhou Li Zhizheng Wu 29 28 0 15 Dec 2023
Audio-Visual Speaker Tracking: Progress, Challenges, and Future Directions Jinzheng Zhao Yong-mei Xu Xinyuan Qian Davide Berghi Peipei Wu Meng Cui Jianyuan Sun Philip J. B. Jackson Wenwu Wang BDL 45 7 0 23 Oct 2023
On Time Domain Conformer Models for Monaural Speech Separation in Noisy Reverberant Acoustic Environments William Ravenscroft Stefan Goetze Thomas Hain 28 7 0 09 Oct 2023
Audio-visual video-to-speech synthesis with synthesized input audio Triantafyllos Kefalas Yannis Panagakis M. Pantic VGen DiffM 38 1 0 31 Jul 2023
An Efficient Speech Separation Network Based on Recurrent Fusion Dilated Convolution and Channel Attention Junyu Wang 22 1 0 09 Jun 2023
BASEN: Time-Domain Brain-Assisted Speech Enhancement Network with Convolutional Cross Attention in Multi-talker Conditions Jie Zhang Qingquan Xu Qiu-shi Zhu Zhenhua Ling 27 11 0 17 May 2023
Universal Source Separation with Weakly Labelled Data Qiuqiang Kong K. Chen Haohe Liu Xingjian Du Taylor Berg-Kirkpatrick Shlomo Dubnov Mark D. Plumbley 18 17 0 11 May 2023
Multi-Channel Masking with Learnable Filterbank for Sound Source Separation Wang Dai A. Politis Tuomas Virtanen 28 0 0 14 Mar 2023
Hypernetworks build Implicit Neural Representations of Sounds Filip Szatkowski Karol J. Piczak Przemtslaw Spurek Jacek Tabor Tomasz Trzciñski 24 11 0 09 Feb 2023
Perceive and predict: self-supervised speech representation based loss functions for speech enhancement George Close William Ravenscroft Thomas Hain Stefan Goetze SSL 38 12 0 11 Jan 2023
ReVISE: Self-Supervised Speech Resynthesis with Visual Input for Universal and Generalized Speech Enhancement Wei-Ning Hsu Tal Remez Bowen Shi Jacob Donley Yossi Adi DiffM 27 12 0 21 Dec 2022
DeFT-AN: Dense Frequency-Time Attentive Network for Multichannel Speech Enhancement Dongheon Lee Jung-Woo Choi 27 25 0 15 Dec 2022
Multi-Scale Feature Fusion Transformer Network for End-to-End Single Channel Speech Separation Yinhao Xu Jian Zhou L. Tao H. Kwan 30 0 0 14 Dec 2022
Deep neural network techniques for monaural speech enhancement: state of the art analysis P. Ochieng 30 21 0 01 Dec 2022
TF-GridNet: Integrating Full- and Sub-Band Modeling for Speech Separation Zhongqiu Wang Samuele Cornell Shukjae Choi Younglo Lee Byeonghak Kim Shinji Watanabe 38 119 0 22 Nov 2022
HyperSound: Generating Implicit Neural Representations of Audio Signals with Hypernetworks Filip Szatkowski Karol J. Piczak Przemysław Spurek Jacek Tabor Tomasz Trzciñski 23 12 0 03 Nov 2022
Deformable Temporal Convolutional Networks for Monaural Noisy Reverberant Speech Separation William Ravenscroft Stefan Goetze Thomas Hain 33 11 0 27 Oct 2022
Speech Enhancement with Perceptually-motivated Optimization and Dual Transformations Xucheng Wan Kai Liu Z.C. Du Huan Zhou 19 0 0 24 Sep 2022
Streaming Target-Speaker ASR with Neural Transducer Takafumi Moriya Hiroshi Sato Tsubasa Ochiai Marc Delcroix T. Shinozaki 31 21 0 09 Sep 2022
Joint Training of Speech Enhancement and Self-supervised Model for Noise-robust ASR Qiu-shi Zhu Jie Zhang Zitian Zhang Lirong Dai 43 15 0 26 May 2022
SepIt: Approaching a Single Channel Speech Separation Bound Shahar Lutati Eliya Nachmani Lior Wolf VLM 43 27 0 24 May 2022
A Conformer-based Waveform-domain Neural Acoustic Echo Canceller Optimized for ASR Accuracy S. Panchapagesan A. Narayanan T. Shabestary Shuai Shao N. Howard Alex Park James Walker A. Gruenstein 24 3 0 06 May 2022
Mask scalar prediction for improving robust automatic speech recognition A. Narayanan James Walker S. Panchapagesan N. Howard Yuma Koizumi 19 4 0 26 Apr 2022
Receptive Field Analysis of Temporal Convolutional Networks for Monaural Speech Dereverberation William Ravenscroft Stefan Goetze Thomas Hain 11 8 0 13 Apr 2022
tPLCnet: Real-time Deep Packet Loss Concealment in the Time Domain Using a Short Temporal Context Nils L. Westhausen B. Meyer 21 7 0 04 Apr 2022
End-to-End Integration of Speech Recognition, Speech Enhancement, and Self-Supervised Learning Representation Xuankai Chang Takashi Maekaku Yuya Fujita Shinji Watanabe VLM 54 45 0 01 Apr 2022
Deep Impulse Responses: Estimating and Parameterizing Filters with Deep Networks Alexander Richard Peter Dodds V. Ithapu 32 36 0 07 Feb 2022
SkiM: Skipping Memory LSTM for Low-Latency Real-Time Continuous Speech Separation Chenda Li Lei Yang Weiqin Wang Y. Qian 32 25 0 26 Jan 2022
A Time-domain Real-valued Generalized Wiener Filter for Multi-channel Neural Separation Systems Yi Luo 29 14 0 07 Dec 2021
MoRe-Fi: Motion-robust and Fine-grained Respiration Monitoring via Deep-Learning UWB Radar Tianyue Zheng Zhe Chen Shujie Zhang Chao Cai Jun Luo 29 93 0 16 Nov 2021
Reduction of Subjective Listening Effort for TV Broadcast Signals with Recurrent Neural Networks Nils L. Westhausen R. Huber Hannah Baumgartner Ragini Sinha J. Rennies B. Meyer 27 10 0 02 Nov 2021
Real-time Speaker counting in a cocktail party scenario using Attention-guided Convolutional Neural Network Midia Yousefi John H. L. Hansen 28 10 0 30 Oct 2021
Cross-attention conformer for context modeling in speech enhancement for ASR A. Narayanan Chung-Cheng Chiu Tom O'Malley Quan Wang Yanzhang He 24 14 0 30 Oct 2021
SA-SDR: A novel loss function for separation of meeting style data Thilo von Neumann K. Kinoshita Christoph Boeddeker Marc Delcroix Reinhold Haeb-Umbach 29 20 0 29 Oct 2021
Closing the Gap Between Time-Domain Multi-Channel Speech Enhancement on Real and Simulation Conditions Wangyou Zhang Jing Shi Chenda Li Shinji Watanabe Y. Qian 36 22 0 27 Oct 2021
Progressive Learning for Stabilizing Label Selection in Speech Separation with Mapping-based Method Chenyang Gao Yue Gu I. Marsic 38 0 0 20 Oct 2021
SDR -- Medium Rare with Fast Computations Robin Scheibler 26 17 0 13 Oct 2021
All-neural beamformer for continuous speech separation Zhuohuang Zhang Takuya Yoshioka Naoyuki Kanda Zhuo Chen Xiaofei Wang Dongmei Wang Sefik Emre Eskimez 33 15 0 13 Oct 2021
Learning Sparse Analytic Filters for Piano Transcription Frank Cwitkowitz M. Heydari Z. Duan 27 2 0 23 Aug 2021