Diffusion-Based Voice Conversion with Fast Maximum Likelihood Sampling Scheme

28 September 2021

Papers citing "Diffusion-Based Voice Conversion with Fast Maximum Likelihood Sampling Scheme"

26 / 26 papers shown

Title
TAMO:Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data Qi. Wang Xiao Zhang Mingyi Li Yuan Yuan Mengbai Xiao Fuzhen Zhuang Dongxiao Yu 36 0 0 29 Apr 2025
Integration Flow Models Jingjing Wang Dan Zhang Joshua Luo Yin Yang Feng Luo 211 0 0 28 Apr 2025
A Diffusion Model Translator for Efficient Image-to-Image Translation Mengfei Xia Yu Zhou Ran Yi Yu Liu Wenping Wang VLM 72 11 0 01 Feb 2025
Generative Modelling with High-Order Langevin Dynamics Ziqiang Shi Rujie Liu DiffM 62 2 0 03 Jan 2025
EmoReg: Directional Latent Vector Modeling for Emotional Intensity Regularization in Diffusion-based Voice Conversion Ashishkumar Gudmalwar Ishan D. Biyani Nirmesh J. Shah Pankaj Wasnik R. Shah DiffM 28 0 0 31 Dec 2024
A Comprehensive Survey with Critical Analysis for Deepfake Speech Detection Lam Pham Phat Lam Dat Tran Hieu Tang Tin Nguyen Alexander Schindler Canh Vu Alexander Polonsky Canh Vu 61 3 0 23 Sep 2024
Improving Robustness of Diffusion-Based Zero-Shot Speech Synthesis via Stable Formant Generation C. Han Seokgi Lee Gyuhyeon Nam Gyeongsu Chae DiffM 218 0 0 14 Sep 2024
Should you use a probabilistic duration model in TTS? Probably! Especially for spontaneous speech Shivam Mehta Harm Lameris Rajiv Punmiya Jonas Beskow Éva Székely G. Henter 33 1 0 08 Jun 2024
VoiceShop: A Unified Speech-to-Speech Framework for Identity-Preserving Zero-Shot Voice Editing Philip Anastassiou Zhenyu Tang Kainan Peng Dongya Jia Jiaxin Li Ming Tu Yuping Wang Yuxuan Wang Mingbo Ma 42 4 0 10 Apr 2024
Detecting Multimedia Generated by Large AI Models: A Survey Li Lin Neeraj Gupta Yue Zhang Hainan Ren Chun-Hao Liu Feng Ding Xin Wang Xin Li Luisa Verdoliva Shu Hu 88 58 0 22 Jan 2024
Diff-HierVC: Diffusion-based Hierarchical Voice Conversion with Robust Pitch Generation and Masked Prior for Zero-shot Speaker Adaptation Haram Choi Sang-Hoon Lee Seong-Whan Lee DiffM 34 24 0 08 Nov 2023
Towards More Accurate Diffusion Model Acceleration with A Timestep Aligner Mengfei Xia Yujun Shen Changsong Lei Yu Zhou Ran Yi Deli Zhao Wenping Wang Yong-jin Liu 27 5 0 14 Oct 2023
Highly Controllable Diffusion-based Any-to-Any Voice Conversion Model with Frame-level Prosody Feature Kyungguen Byun Sunkuk Moon Erik Visser DiffM 37 1 0 06 Sep 2023
Stylebook: Content-Dependent Speaking Style Modeling for Any-to-Any Voice Conversion using Only Speech Data Hyungseob Lim Kyungguen Byun Sunkuk Moon Erik Visser DiffM 28 2 0 06 Sep 2023
DiCLET-TTS: Diffusion Model based Cross-lingual Emotion Transfer for Text-to-Speech -- A Study between English and Mandarin Tao Li Chenxu Hu Jian Cong Xinfa Zhu Jingbei Li Qiao Tian Yuping Wang Linfu Xie DiffM 43 8 0 02 Sep 2023
LightGrad: Lightweight Diffusion Probabilistic Model for Text-to-Speech Jing Chen Xingcheng Song Zhendong Peng Binbin Zhang Fuping Pan Zhiyong Wu DiffM 32 16 0 31 Aug 2023
HierVST: Hierarchical Adaptive Zero-shot Voice Style Transfer Sang-Hoon Lee Haram Choi H. Oh Seong-Whan Lee BDL 30 9 0 30 Jul 2023
Reducing the Prior Mismatch of Stochastic Differential Equations for Diffusion-based Speech Enhancement Bunlong Lay Simon Welker Julius Richter Timo Gerkmann DiffM 16 24 0 28 Feb 2023
Diffusion Model-Augmented Behavioral Cloning Shangcheng Chen Hsiang-Chun Wang Ming-Hao Hsu Chun-Mao Lai Shao-Hua Sun DiffM 60 31 0 26 Feb 2023
Grad-StyleSpeech: Any-speaker Adaptive Text-to-Speech Synthesis with Diffusion Models Minki Kang Dong Min Sung Ju Hwang DiffM 25 48 0 17 Nov 2022
DisC-VC: Disentangled and F0-Controllable Neural Voice Conversion Chihiro Watanabe Hirokazu Kameoka DRL 37 0 0 20 Oct 2022
Estimating the Optimal Covariance with Imperfect Mean in Diffusion Probabilistic Models Fan Bao Chongxuan Li Jiacheng Sun Jun Zhu Bo Zhang DiffM 36 73 0 15 Jun 2022
Multi-instrument Music Synthesis with Spectrogram Diffusion Curtis Hawthorne Ian Simon Adam Roberts Neil Zeghidour Josh Gardner Ethan Manilow Jesse Engel DiffM 23 49 0 11 Jun 2022
DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps Cheng Lu Yuhao Zhou Fan Bao Jianfei Chen Chongxuan Li Jun Zhu DiffM 74 1,351 0 02 Jun 2022
Learning the Beauty in Songs: Neural Singing Voice Beautifier Jinglin Liu Chengxi Li Yi Ren Zhiying Zhu Zhou Zhao DiffM 35 16 0 27 Feb 2022
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis Ye Jia Yu Zhang Ron J. Weiss Quan Wang Jonathan Shen ... Zhiwen Chen Patrick Nguyen Ruoming Pang Ignacio López Moreno Yonghui Wu 207 820 0 12 Jun 2018