Real Time Speech Enhancement in the Waveform Domain

23 June 2020

Yossi Adi

Papers citing "Real Time Speech Enhancement in the Waveform Domain"

27 / 77 papers shown

Title
NASTAR: Noise Adaptive Speech Enhancement with Target-Conditional Resampling Chi-Chang Lee Cheng-Hung Hu Yu-Chen Lin Chu-Song Chen Hsin-Min Wang Yu Tsao 41 2 0 18 Jun 2022
To Dereverb Or Not to Dereverb? Perceptual Studies On Real-Time Dereverberation Targets J. Valin Ritwik Giri Shrikant Venkataramani Umut Isik A. Krishnaswamy 13 2 0 16 Jun 2022
Joint Training of Speech Enhancement and Self-supervised Model for Noise-robust ASR Qiu-shi Zhu Jie Zhang Zitian Zhang Lirong Dai 43 15 0 26 May 2022
Speaker Reinforcement Using Target Source Extraction for Robust Automatic Speech Recognition Catalin Zorila R. Doddipatla 24 11 0 09 May 2022
Taylor, Can You Hear Me Now? A Taylor-Unfolding Framework for Monaural Speech Enhancement Andong Li Shan You Guochen Yu C. Zheng Xiaodong Li 30 26 0 30 Apr 2022
VoiceFixer: A Unified Framework for High-Fidelity Speech Restoration Haohe Liu Xubo Liu Qiuqiang Kong Qiao Tian Yan Zhao DeLiang Wang Chuanzeng Huang Yuxuan Wang 15 51 0 12 Apr 2022
FFC-SE: Fast Fourier Convolution for Speech Enhancement Ivan Shchekotov Pavel Andreev Oleg Ivanov Aibek Alanov Dmitry Vetrov 21 23 0 06 Apr 2022
Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis Karren D. Yang Dejan Marković Steven Krenn Vasu Agrawal Alexander Richard VGen 16 32 0 31 Mar 2022
A Hybrid Continuity Loss to Reduce Over-Suppression for Time-domain Target Speaker Extraction Zexu Pan Meng Ge Haizhou Li 21 17 0 31 Mar 2022
CMGAN: Conformer-based Metric GAN for Speech Enhancement Ru Cao Sherif Abdulatif Bin Yang 21 91 0 28 Mar 2022
HiFi++: a Unified Framework for Bandwidth Extension and Speech Enhancement Pavel Andreev Aibek Alanov Oleg Ivanov Dmitry Vetrov 33 38 0 24 Mar 2022
MDNet: Learning Monaural Speech Enhancement from Deep Prior Gradient Andong Li C. Zheng Ziyang Zhang Xiaodong Li 19 3 0 14 Mar 2022
MANNER: Multi-view Attention Network for Noise Erasure Hyun Joon Park Byung Ha Kang Wooseok Shin Jin Sob Kim S. W. Han 30 48 0 04 Mar 2022
Perceptual Loss with Recognition Model for Single-Channel Enhancement and Robust ASR Peter William VanHarn Plantinga Deblin Bagchi Eric Fosler-Lussier 46 10 0 11 Dec 2021
Self-Supervised Speech Denoising Using Only Noisy Audio Signals Jiasong Wu Qingchun Li Guanyu Yang Lei Li L. Senhadji H. Shu 19 10 0 30 Oct 2021
Toward Degradation-Robust Voice Conversion Chien-yu Huang Kai-Wei Chang Hung-yi Lee 25 7 0 14 Oct 2021
Dual-branch Attention-In-Attention Transformer for single-channel speech enhancement Guochen Yu Andong Li C. Zheng Yinuo Guo Yutian Wang Hui Wang 35 84 0 13 Oct 2021
DNSMOS P.835: A Non-Intrusive Perceptual Objective Speech Quality Metric to Evaluate Noise Suppressors Chandan K. A. Reddy Vishak Gopal Ross Cutler 29 194 0 05 Oct 2021
Glance and Gaze: A Collaborative Learning Framework for Single-channel Speech Enhancement Andong Li C. Zheng Lu Zhang Xiaodong Li 11 141 0 22 Jun 2021
DPT-FSNet: Dual-path Transformer Based Full-band and Sub-band Fusion Network for Speech Enhancement Feng Dang Hangting Chen Pengyuan Zhang 76 96 0 27 Apr 2021
Differentiable Model Compression via Pseudo Quantization Noise Alexandre Défossez Yossi Adi Gabriel Synnaeve DiffM MQ 18 47 0 20 Apr 2021
TSTNN: Two-stage Transformer based Neural Network for Speech Enhancement in the Time Domain Kai Wang Bengbeng He Weiping Zhu 35 165 0 18 Mar 2021
Speech Enhancement Using Multi-Stage Self-Attentive Temporal Convolutional Networks Ju Lin A. Wijngaarden Kuang-Ching Wang M. C. Smith 10 50 0 24 Feb 2021
CDPAM: Contrastive learning for perceptual audio similarity Pranay Manocha Zeyu Jin Richard Y. Zhang Adam Finkelstein 19 68 0 09 Feb 2021
DNSMOS: A Non-Intrusive Perceptual Objective Speech Quality metric to evaluate Noise Suppressors Chandan K. A. Reddy Vishak Gopal Ross Cutler 35 291 0 28 Oct 2020
Weighted Speech Distortion Losses for Neural-network-based Real-time Speech Enhancement Yangyang Xia Sebastian Braun Chandan K. A. Reddy Harishchandra Dubey Ross Cutler I. Tashev 29 119 0 28 Jan 2020
A scalable noisy speech dataset and online subjective test framework Chandan K. A. Reddy Ebrahim Beyrami Jamie Pool Ross Cutler Sriram Srinivasan J. Gehrke 72 143 0 17 Sep 2019