Distinguishing Neural Speech Synthesis Models Through Fingerprints in
Speech Waveforms

Distinguishing Neural Speech Synthesis Models Through Fingerprints in Speech Waveforms

13 September 2023

Jiangyan Yi

Papers citing "Distinguishing Neural Speech Synthesis Models Through Fingerprints in Speech Waveforms"

9 / 9 papers shown

Title
STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Open-Set Source Tracing and Attribution Anton Firc Manasi Chibber Jagabandhu Mishra Vishwanath Pratap Singh Tomi Kinnunen K. Malinka 103 0 0 26 May 2025
ADD 2022: the First Audio Deep Synthesis Detection Challenge Jiangyan Yi Ruibo Fu J. Tao Shuai Nie Haoxin Ma ... Le Xu Zhengqi Wen Haizhou Li Zheng Lian Bin Liu 40 180 0 17 Feb 2022
ASVspoof 2021: accelerating progress in spoofed and deepfake speech detection Junichi Yamagishi Xin Wang Massimiliano Todisco Md. Sahidullah J. Patino ... Xuechen Liu Kong Aik Lee Tomi Kinnunen Nicholas W. D. Evans Héctor Delgado 56 343 0 01 Sep 2021
Grad-TTS: A Diffusion Probabilistic Model for Text-to-Speech Vadim Popov Ivan Vovk Vladimir Gogoryan Tasnima Sadekova Mikhail Kudinov DiffM 84 526 0 13 May 2021
StyleMelGAN: An Efficient High-Fidelity Adversarial Vocoder with Temporal Adaptive Normalization Ahmed Mustafa N. Pia Guillaume Fuchs 35 72 0 03 Nov 2020
HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis Jungil Kong Jaehyeon Kim Jaekyoung Bae 130 1,918 0 12 Oct 2020
FastSpeech 2: Fast and High-Quality End-to-End Text to Speech Yi Ren Chenxu Hu Xu Tan Tao Qin Sheng Zhao Zhou Zhao Tie-Yan Liu 97 1,382 0 08 Jun 2020
Multi-band MelGAN: Faster Waveform Generation for High-Quality Text-to-Speech Geng Yang Shan Yang Kai-Chun Liu Peng Fang Wei Chen Lei Xie 104 199 0 11 May 2020
LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech Heiga Zen Viet Dang R. Clark Yu Zhang Ron J. Weiss Ye Jia Zhiwen Chen Yonghui Wu 78 933 0 05 Apr 2019