SafeEar: Content Privacy-Preserving Audio Deepfake Detection

14 September 2024

Xinfeng Li

Xiaoyu Ji

Papers citing "SafeEar: Content Privacy-Preserving Audio Deepfake Detection"

32 / 32 papers shown

Title
Scale-Invariant Adversarial Attack against Arbitrary-scale Super-resolution Yihao Huang Xin Luo Yihao Huang Felix Juefei-Xu Xiaojun Jia Weikai Miao G. Pu Yang Liu 97 2 0 06 Mar 2025
Survey on AI-Generated Media Detection: From Non-MLLM to MLLM Yueying Zou Peipei Li Zekun Li Huaibo Huang Xing Cui Xuannan Liu Chenghanyu Zhang Ran He DeLMO 166 3 0 07 Feb 2025
AI-generated Image Detection: Passive or Watermark? Moyang Guo Yuepeng Hu Zhengyuan Jiang Zeyu Li Amir Sadovnik Arka Daw Neil Zhenqiang Gong 179 1 0 20 Nov 2024
PITCH: AI-assisted Tagging of Deepfake Audio Calls using Challenge-Response Govind Mittal Arthur Jakobsson Kelly O. Marshall Chinmay Hegde Nasir Memon 80 0 0 28 Feb 2024
Enrollment-stage Backdoor Attacks on Speaker Recognition Systems via Adversarial Ultrasound Xinfeng Li Junning Ze Chen Yan Yushi Cheng Xiaoyu Ji Wenyuan Xu AAML 58 12 0 28 Jun 2023
HiFi-WaveGAN: Generative Adversarial Network with Auxiliary Spectrogram-Phase Loss for High-Fidelity Singing Voice Generation Chunhui Wang Chang Zeng Jun Chen Xingji He 77 7 0 23 Oct 2022
AudioLM: a Language Modeling Approach to Audio Generation Zalan Borsos Raphaël Marinier Damien Vincent Eugene Kharitonov Olivier Pietquin ... Dominik Roblek O. Teboul David Grangier Marco Tagliasacchi Neil Zeghidour AuLLM 151 608 0 07 Sep 2022
Joint Speaker Encoder and Neural Back-end Model for Fully End-to-End Automatic Speaker Verification with Multiple Enrollment Utterances Chang Zeng Xiaoxiao Miao Xin Wang Erica Cooper Junichi Yamagishi 56 6 0 01 Sep 2022
On the Use of Deep Mask Estimation Module for Neural Source Separation Systems Kai Li Xiaolin Hu Yi Luo 60 16 0 15 Jun 2022
FullSubNet+: Channel Attention FullSubNet with Complex Spectrograms for Speech Enhancement Jun Chen Zehao Wang Deyi Tuo Zhiyong Wu Shiyin Kang Helen Meng 53 108 0 23 Mar 2022
Synthetic speech detection using meta-learning with prototypical loss Monisankha Pal Aditya Raikar Ashish Panda Sunil Kumar Kopparapu 58 4 0 24 Jan 2022
ASVspoof 2021: accelerating progress in spoofed and deepfake speech detection Junichi Yamagishi Xin Wang Massimiliano Todisco Md. Sahidullah J. Patino ... Xuechen Liu Kong Aik Lee Tomi Kinnunen Nicholas W. D. Evans Héctor Delgado 65 347 0 01 Sep 2021
A Survey on Neural Speech Synthesis Xu Tan Tao Qin Frank Soong Tie-Yan Liu AI4TS 105 359 0 29 Jun 2021
HuBERT: Self-Supervised Speech Representation Learning by Masked Prediction of Hidden Units Wei-Ning Hsu Benjamin Bolte Yao-Hung Hubert Tsai Kushal Lakhotia Ruslan Salakhutdinov Abdel-rahman Mohamed SSL 180 2,966 0 14 Jun 2021
Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech Jaehyeon Kim Jungil Kong Juhee Son DRL 122 884 0 11 Jun 2021
SpeechBrain: A General-Purpose Speech Toolkit Mirco Ravanelli Titouan Parcollet Peter William VanHarn Plantinga Aku Rouhe Samuele Cornell ... William Aris Hwidong Na Yan Gao R. Mori Yoshua Bengio 80 767 0 08 Jun 2021
Attention Back-end for Automatic Speaker Verification with Multiple Enrollment Utterances Chang Zeng Xin Wang Erica Cooper Xiaoxiao Miao Junichi Yamagishi 78 21 0 04 Apr 2021
ASVspoof 2019: spoofing countermeasures for the detection of synthesized, converted and replayed speech A. Nautsch Xin Wang Nicholas W. D. Evans Tomi Kinnunen Ville Vestman Massimiliano Todisco Héctor Delgado Md. Sahidullah Junichi Yamagishi Kong Aik Lee 153 149 0 11 Feb 2021
StyleMelGAN: An Efficient High-Fidelity Adversarial Vocoder with Temporal Adaptive Normalization Ahmed Mustafa N. Pia Guillaume Fuchs 64 73 0 03 Nov 2020
Speaker anonymisation using the McAdams coefficient J. Patino N. Tomashenko Massimiliano Todisco A. Nautsch Nicholas W. D. Evans 81 93 0 02 Nov 2020
One-class Learning Towards Synthetic Voice Spoofing Detection You Zhang Fei Jiang Z. Duan 65 216 0 27 Oct 2020
HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech Synthesis Jungil Kong Jaehyeon Kim Jaekyoung Bae 177 1,936 0 12 Oct 2020
An Overview of Voice Conversion and its Challenges: From Statistical Modeling to Deep Learning Berrak Sisman Junichi Yamagishi Simon King Haizhou Li BDL 104 322 0 09 Aug 2020
FastSpeech 2: Fast and High-Quality End-to-End Text to Speech Yi Ren Chenxu Hu Xu Tan Tao Qin Sheng Zhao Zhou Zhao Tie-Yan Liu 105 1,396 0 08 Jun 2020
Conformer: Convolution-augmented Transformer for Speech Recognition Anmol Gulati James Qin Chung-Cheng Chiu Niki Parmar Yu Zhang ... Wei Han Shibo Wang Zhengdong Zhang Yonghui Wu Ruoming Pang 223 3,139 0 16 May 2020
Multi-band MelGAN: Faster Waveform Generation for High-Quality Text-to-Speech Geng Yang Shan Yang Kai-Chun Liu Peng Fang Wei Chen Lei Xie 121 199 0 11 May 2020
Common Voice: A Massively-Multilingual Speech Corpus Rosana Ardila Megan Branson Kelly Davis Michael Henretty M. Kohler Josh Meyer Reuben Morais Lindsay Saunders Francis M. Tyers Gregor Weber VLM 91 1,600 0 13 Dec 2019
PyTorch: An Imperative Style, High-Performance Deep Learning Library Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury ... Sasank Chilamkurthy Benoit Steiner Lu Fang Junjie Bai Soumith Chintala ODL 511 42,449 0 03 Dec 2019
Parallel WaveGAN: A fast waveform generation model based on generative adversarial networks with multi-resolution spectrogram Ryuichi Yamamoto Eunwoo Song Jae-Min Kim 56 818 0 25 Oct 2019
AUTOVC: Zero-Shot Voice Style Transfer with Only Autoencoder Loss Kaizhi Qian Yang Zhang Shiyu Chang Xuesong Yang M. Hasegawa-Johnson 81 465 0 14 May 2019
Audio Adversarial Examples: Targeted Attacks on Speech-to-Text Nicholas Carlini D. Wagner AAML 97 1,083 0 05 Jan 2018
Neural Discrete Representation Learning Aaron van den Oord Oriol Vinyals Koray Kavukcuoglu BDL SSL OCL 226 5,019 0 02 Nov 2017