HiFi-GAN: High-Fidelity Denoising and Dereverberation Based on Speech
Deep Features in Adversarial Networks

HiFi-GAN: High-Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks

10 June 2020

Jiaqi Su

Adam Finkelstein

Papers citing "HiFi-GAN: High-Fidelity Denoising and Dereverberation Based on Speech Deep Features in Adversarial Networks"

19 / 19 papers shown

Title
Miipher-2: A Universal Speech Restoration Model for Million-Hour Scale Data Restoration Shigeki Karita Yuma Koizumi Heiga Zen Haruko Ishikawa Robin Scheibler M. Bacchiani VLM 148 1 0 07 May 2025
LibriTTS-R: A Restored Multi-Speaker Text-to-Speech Corpus Yuma Koizumi Heiga Zen Shigeki Karita Yifan Ding Kohei Yatabe Nobuyuki Morioka M. Bacchiani Yu Zhang Wei Han Ankur Bapna 36 66 0 30 May 2023
Audio Denoising for Robust Audio Fingerprinting Kamil Akesbi 13 3 0 21 Dec 2022
Deep neural network techniques for monaural speech enhancement: state of the art analysis P. Ochieng 28 21 0 01 Dec 2022
Hierarchical Diffusion Models for Singing Voice Neural Vocoder Naoya Takahashi Mayank Kumar Singh Yuki Mitsufuji DiffM 13 16 0 14 Oct 2022
Pre-Avatar: An Automatic Presentation Generation Framework Leveraging Talking Avatar Aolan Sun Xulong Zhang Tiandong Ling Jianzong Wang Ning Cheng Jing Xiao 24 4 0 13 Oct 2022
WaveFit: An Iterative and Non-autoregressive Neural Vocoder based on Fixed-Point Iteration Yuma Koizumi Kohei Yatabe Heiga Zen M. Bacchiani DiffM 42 29 0 03 Oct 2022
Stochastic Restoration of Heavily Compressed Musical Audio using Generative Adversarial Networks Stefan Lattner J. Nistal 30 11 0 04 Jul 2022
AdaVITS: Tiny VITS for Low Computing Resource Speaker Adaptation Kun Song Heyang Xue Xinsheng Wang Jian Cong Yongmao Zhang Linfu Xie Bing Yang Xiong Zhang Dan Su 11 5 0 01 Jun 2022
Audio-Visual Speech Codecs: Rethinking Audio-Visual Speech Enhancement by Re-Synthesis Karren D. Yang Dejan Marković Steven Krenn Vasu Agrawal Alexander Richard VGen 16 32 0 31 Mar 2022
SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with Adaptive Noise Spectral Shaping Yuma Koizumi Heiga Zen Kohei Yatabe Nanxin Chen M. Bacchiani DiffM 23 45 0 31 Mar 2022
DDS: A new device-degraded speech dataset for speech enhancement Haoyu Li Junichi Yamagishi 18 7 0 16 Sep 2021
EditSpeech: A Text Based Speech Editing System Using Partial Inference and Bidirectional Fusion Daxin Tan Liqun Deng Y. Yeung Xin Jiang Xiao Chen Tan Lee 19 37 0 04 Jul 2021
UniTTS: Residual Learning of Unified Embedding Space for Speech Style Control M. Kang Sungjae Kim Injung Kim 21 3 0 21 Jun 2021
Restoring degraded speech via a modified diffusion model Jianwei Zhang Suren Jayasuriya Visar Berisha DiffM 14 19 0 22 Apr 2021
Context-Aware Prosody Correction for Text-Based Speech Editing Max Morrison Lucas Rencker Zeyu Jin Nicholas J. Bryan Juan-Pablo Caceres Bryan Pardo 22 28 0 16 Feb 2021
Enhancing Low-Quality Voice Recordings Using Disentangled Channel Factor and Neural Waveform Model Haoyu Li Yang Ai Junichi Yamagishi 9 2 0 10 Nov 2020
High Fidelity Speech Synthesis with Adversarial Networks Mikolaj Binkowski Jeff Donahue Sander Dieleman Aidan Clark Erich Elsen Norman Casagrande Luis C. Cobo Karen Simonyan 220 239 0 25 Sep 2019
Wave-U-Net: A Multi-Scale Neural Network for End-to-End Audio Source Separation Daniel Stoller Sebastian Ewert S. Dixon AI4TS 104 588 0 08 Jun 2018