StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation

22 December 2022

Papers citing "StoRM: A Diffusion-based Stochastic Regeneration Model for Speech Enhancement and Dereverberation"

50 / 54 papers shown

Title
DiTSE: High-Fidelity Generative Speech Enhancement via Latent Diffusion Transformers Heitor R. Guimarães Jiaqi Su Rithesh Kumar Tiago H. Falk Zeyu Jin DiffM 30 2 0 13 Apr 2025
Accelerating Diffusion Sampling via Exploiting Local Transition Coherence Shangwen Zhu Han Zhang Zhantao Yang Qianyu Peng Zhao Pu Haoran Wang Fan Cheng DiffM 48 0 0 12 Mar 2025
Linguistic Knowledge Transfer Learning for Speech Enhancement Kuo-Hsuan Hung Xugang Lu Szu-Wei Fu H. Tseng Hsin-Yi Lin Chii-Wann Lin Yu Tsao VLM 65 0 0 10 Mar 2025
FlowDec: A flow-based full-band general audio codec with high perceptual quality Simon Welker Matthew Le Ricky T. Q. Chen Wei-Ning Hsu Timo Gerkmann Alexander Richard Yi-Chiao Wu 58 0 0 03 Mar 2025
CleanMel: Mel-Spectrogram Enhancement for Improving Both Speech Quality and ASR Nian Shao Rui Zhou Pengyu Wang Xian Li Ying Fang Yujie Yang Xiaofei Li 39 0 0 27 Feb 2025
Speech Enhancement Using Continuous Embeddings of Neural Audio Codec Haoyang Li J. Yip Tianyu Fan Eng Siong Chng 54 0 0 22 Feb 2025
RestoreGrad: Signal Restoration Using Conditional Denoising Diffusion Models with Jointly Learned Prior Ching Hua Lee Chouchang Yang Jaejin Cho Yashas Malur Saidutta R. S. Srinivasa Yilin Shen Hongxia Jin DiffM 85 0 0 19 Feb 2025
AudioMiXR: Spatial Audio Object Manipulation with 6DoF for Sound Design in Augmented Reality Brandon Woodard Margarita Geleta Joseph J. LaViola Jr. Andrea Fanelli Rhonda Wilson 57 1 0 05 Feb 2025
AnyEnhance: A Unified Generative Model with Prompt-Guidance and Self-Critic for Voice Enhancement Junan Zhang Jing Yang Zihao Fang Yali Wang Zehua Zhang Zhuo Wang Fan Fan Z. Wu 41 2 0 26 Jan 2025
Improving Source Extraction with Diffusion and Consistency Models Tornike Karchkhadze M. Izadi Shuo Zhang DiffM 82 1 0 09 Dec 2024
GAN-Based Speech Enhancement for Low SNR Using Latent Feature Conditioning Shrishti Saha Shetu Emanuël A. P. Habets Andreas Brendel 26 1 0 17 Oct 2024
FINALLY: fast and universal speech enhancement with studio-like quality Nicholas Babaev Kirill Tamogashev Azat Saginbaev Ivan Shchekotov Hanbin Bae Hosang Sung WonJun Lee Hoon-Young Cho Pavel Andreev 29 2 0 08 Oct 2024
Restorative Speech Enhancement: A Progressive Approach Using SE and Codec Modules Hsin-Tien Chiang Hao Zhang Yong Xu Meng Yu Dong Yu 28 1 0 02 Oct 2024
An Explicit Consistency-Preserving Loss Function for Phase Reconstruction and Speech Enhancement Pin-Jui Ku Chun-Wei Ho Hao Yen Sabato Marco Siniscalchi Chin-Hui Lee 21 0 0 24 Sep 2024
GALD-SE: Guided Anisotropic Lightweight Diffusion for Efficient Speech Enhancement Chengzhong Wang Jianjun Gu Dingding Yao Junfeng Li Yonghong Yan DiffM 131 0 0 23 Sep 2024
High-Resolution Speech Restoration with Latent Diffusion Model Tushar Dhyani Florian Lux Michele Mancusi Giorgio Fabbro Fritz Hohl Ngoc Thang Vu DiffM 37 0 0 17 Sep 2024
Joint Semantic Knowledge Distillation and Masked Acoustic Modeling for Full-band Speech Restoration with Improved Intelligibility Xiaoyu Liu Xu Li Joan Serra Santiago Pascual 31 3 0 14 Sep 2024
Diffusion-based Speech Enhancement with Schrödinger Bridge and Symmetric Noise Schedule Siyi Wang Siyi Liu Andrew Harper Paul Kendrick Mathieu Salzmann Milos Cernak DiffM 32 2 0 08 Sep 2024
Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models Jean-Marie Lemercier Eloi Moliner Simon Welker Vesa Valimaki Timo Gerkmann 51 2 0 14 Aug 2024
Diffusion-based Generative Modeling with Discriminative Guidance for Streamable Speech Enhancement Chenda Li Samuele Cornell Shinji Watanabe Yanmin Qian DiffM 29 2 0 19 Jun 2024
Universal Score-based Speech Enhancement with High Content Preservation Robin Scheibler Yusuke Fujita Yuma Shirahata Tatsuya Komatsu DiffM 37 10 0 18 Jun 2024
FlowAVSE: Efficient Audio-Visual Speech Enhancement with Conditional Flow Matching Chaeyoung Jung Suyeon Lee Ji-Hoon Kim Joon Son Chung DiffM 47 4 0 13 Jun 2024
Pre-training Feature Guided Diffusion Model for Speech Enhancement Yiyuan Yang Niki Trigoni Andrew Markham 21 2 0 11 Jun 2024
Thunder : Unified Regression-Diffusion Speech Enhancement with a Single Reverse Step using Brownian Bridge Thanapat Trachu Chawan Piansaddhayanon E. Chuangsuwanich 29 2 0 10 Jun 2024
MaskSR: Masked Language Model for Full-band Speech Restoration Xu Li Qirui Wang Xiaoyu Liu 44 8 0 04 Jun 2024
Gaussian Flow Bridges for Audio Domain Transfer with Unpaired Data Eloi Moliner Sebastian Braun H. Gamper OT 47 2 0 29 May 2024
Mamba in Speech: Towards an Alternative to Self-Attention Xiangyu Zhang Qiquan Zhang Hexin Liu Tianyi Xiao Xinyuan Qian Beena Ahmed E. Ambikairajah Haizhou Li Julien Epps Mamba 54 36 0 21 May 2024
BUDDy: Single-Channel Blind Unsupervised Dereverberation with Diffusion Models Eloi Moliner Jean-Marie Lemercier Simon Welker Timo Gerkmann Vesa Valimaki DiffM 43 4 0 07 May 2024
A Survey on Diffusion Models for Time Series and Spatio-Temporal Data Yiyuan Yang Ming Jin Haomin Wen Chaoli Zhang Yuxuan Liang ... Bin Yang Zenglin Xu Jiang Bian Shirui Pan Qingsong Wen DiffM AI4TS SyDa 37 38 0 29 Apr 2024
Exploring the Potential of Data-Driven Spatial Audio Enhancement Using a Single-Channel Model Arthur N. dos Santos Bruno S. Masiero Túlio C. L. Mateus 36 0 0 22 Apr 2024
Crowdsourced Multilingual Speech Intelligibility Testing Laura Lechler Kamil Wojcicki 30 0 0 21 Mar 2024
Diffusion Models for Audio Restoration Jean-Marie Lemercier Julius Richter Simon Welker Eloi Moliner Vesa Valimaki Timo Gerkmann 38 16 0 15 Feb 2024
GLA-Grad: A Griffin-Lim Extended Waveform Generation Diffusion Model Haocheng Liu Teysir Baoueb Mathieu Fontaine Jonathan Le Roux Gaël Richard 31 4 0 09 Feb 2024
FADI-AEC: Fast Score Based Diffusion Model Guided by Far-end Signal for Acoustic Echo Cancellation Yang Liu Liting Wan Yun Li Yiteng Huang Ming Sun James Luan Yangyang Shi Xin Lei 31 0 0 08 Jan 2024
Investigating the Design Space of Diffusion Models for Speech Enhancement Philippe Gonzalez Zheng-Hua Tan Jan Østergaard Jesper Jensen T. S. Alstrøm Tobias May DiffM 27 6 0 07 Dec 2023
Seeing Through the Conversation: Audio-Visual Speech Separation based on Diffusion Model Suyeon Lee Chaeyoung Jung Youngjoon Jang Jaehun Kim Joon Son Chung 33 7 0 30 Oct 2023
Conditional Diffusion Model for Target Speaker Extraction Theodor Nguyen Guangzhi Sun Xianrui Zheng Chao Zhang 0031 Philip C. Woodland DiffM 35 4 0 07 Oct 2023
Single and Few-step Diffusion for Generative Speech Enhancement Bunlong Lay Jean-Marie Lemercier Julius Richter Timo Gerkmann DiffM 19 9 0 18 Sep 2023
Unifying Robustness and Fidelity: A Comprehensive Study of Pretrained Generative Methods for Speech Enhancement in Adverse Conditions Heming Wang Meng Yu H. M. Zhang Chunlei Zhang Zhongweiyang Xu Muqiao Yang Yixuan Zhang Dong Yu 29 3 0 16 Sep 2023
NADiffuSE: Noise-aware Diffusion-based Model for Speech Enhancement Wen Wang Dongchao Yang Qichen Ye Bowen Cao Yuexian Zou DiffM 34 3 0 03 Sep 2023
Target Speech Extraction with Conditional Diffusion Model Naoyuki Kamo Marc Delcroix Tomohiro Nakatan DiffM 28 16 0 08 Aug 2023
Noise-aware Speech Enhancement using Diffusion Probabilistic Model Yuchen Hu Cheng Chen Ruizhe Li Qiu-shi Zhu E. Chng DiffM 16 9 0 16 Jul 2023
Wind Noise Reduction with a Diffusion-based Stochastic Regeneration Model Jean-Marie Lemercier J. Thiemann Raphael Koning Timo Gerkmann DiffM 21 1 0 22 Jun 2023
Diffusion Posterior Sampling for Informed Single-Channel Dereverberation Jean-Marie Lemercier Simon Welker Timo Gerkmann DiffM 23 5 0 21 Jun 2023
The Age of Synthetic Realities: Challenges and Opportunities J. P. Cardenuto Jing Yang Rafael Padilha Renjie Wan Daniel Moreira Haoliang Li Shiqi Wang Fernanda A. Andaló Sébastien Marcel Anderson de Rezende Rocha DeLMO 42 29 0 09 Jun 2023
Blind Audio Bandwidth Extension: A Diffusion-Based Zero-Shot Approach Eloi Moliner Filip Elvander Vesa Valimaki DiffM 30 10 0 02 Jun 2023
Diffusion-Based Speech Enhancement with Joint Generative and Predictive Decoders Hao Shi Kazuki Shimada M. Hirano Takashi Shibuya Yuichiro Koyama Zhi-Wei Zhong Shusuke Takahashi Tatsuya Kawahara Yuki Mitsufuji DiffM 30 14 0 18 May 2023
Diffusion-based Signal Refiner for Speech Separation M. Hirano Kazuki Shimada Yuichiro Koyama Shusuke Takahashi Yuki Mitsufuji DiffM 33 4 0 10 May 2023
DriftRec: Adapting diffusion models to blind JPEG restoration Simon Welker H. Chapman Timo Gerkmann DiffM 30 11 0 12 Nov 2022
SRTNet: Time Domain Speech Enhancement Via Stochastic Refinement Zhibin Qiu Mengfan Fu Yinfeng Yu Lili Yin Fuchun Sun Hao-Ming Huang DiffM 112 17 0 30 Oct 2022