Unsupervised speech representation learning using WaveNet autoencoders

25 January 2019

Papers citing "Unsupervised speech representation learning using WaveNet autoencoders"

31 / 81 papers shown

Title
Any-to-One Sequence-to-Sequence Voice Conversion using Self-Supervised Discrete Speech Representations Wen-Chin Huang Yi-Chiao Wu Tomoki Hayashi Tomoki Toda BDL 57 37 0 23 Oct 2020
Representation Learning for Sequence Data with Deep Autoencoding Predictive Components Junwen Bai Weiran Wang Yingbo Zhou Caiming Xiong SSL AI4TS 27 12 0 07 Oct 2020
Identity-Based Patterns in Deep Convolutional Networks: Generative Adversarial Phonology and Reduplication Gašper Beguš GAN SSL 13 15 0 13 Sep 2020
An Overview of Voice Conversion and its Challenges: From Statistical Modeling to Deep Learning Berrak Sisman Junichi Yamagishi Simon King Haizhou Li BDL 48 318 0 09 Aug 2020
Pretraining Techniques for Sequence-to-Sequence Voice Conversion Wen-Chin Huang Tomoki Hayashi Yi-Chiao Wu Hirokazu Kameoka Tomoki Toda 27 38 0 07 Aug 2020
Incorporating Reinforced Adversarial Learning in Autoregressive Image Generation Kenan E. Ak N. Xu Zhe Lin Yilin Wang 24 12 0 20 Jul 2020
Vector-Quantized Timbre Representation Adrien Bitton P. Esling Tatsuya Harada 22 12 0 13 Jul 2020
TERA: Self-Supervised Learning of Transformer Encoder Representation for Speech Andy T. Liu Shang-Wen Li Hung-yi Lee SSL 64 356 0 12 Jul 2020
Data Augmenting Contrastive Learning of Speech Representations in the Time Domain Eugene Kharitonov M. Rivière Gabriel Synnaeve Lior Wolf Pierre-Emmanuel Mazaré Matthijs Douze Emmanuel Dupoux 31 117 0 02 Jul 2020
VQVC+: One-Shot Voice Conversion by Vector Quantization and U-Net architecture Da-Yi Wu Yen-Hao Chen Hung-yi Lee 16 99 0 07 Jun 2020
CSTNet: Contrastive Speech Translation Network for Self-Supervised Speech Representation Learning Sameer Khurana Antoine Laurent James R. Glass SSL 19 12 0 04 Jun 2020
High-Fidelity Audio Generation and Representation Learning with Guided Adversarial Autoencoder Kazi Nazmul Haque R. Rana Björn W Schuller DRL 31 12 0 01 Jun 2020
Vector-quantized neural networks for acoustic unit discovery in the ZeroSpeech 2020 challenge Benjamin van Niekerk Leanne Nortje Herman Kamper 33 115 0 19 May 2020
Unconditional Audio Generation with Generative Adversarial Networks and Cycle Regularization Jen-Yu Liu Yu-Hua Chen Yin-Cheng Yeh Yi-Hsuan Yang GAN 34 35 0 18 May 2020
Robust Training of Vector Quantized Bottleneck Models A. Lancucki J. Chorowski Guillaume Sanchez R. Marxer Nanxin Chen Hans J. G. A. Dolfing Sameer Khurana Tanel Alumäe Antoine Laurent 29 58 0 18 May 2020
Vector-Quantized Autoregressive Predictive Coding Yu-An Chung Hao Tang James R. Glass SSL 19 114 0 17 May 2020
DiscreTalk: Text-to-Speech as a Machine Translation Problem Tomoki Hayashi Shinji Watanabe 27 32 0 12 May 2020
Does Visual Self-Supervision Improve Learning of Speech Representations for Emotion Recognition? Abhinav Shukla Stavros Petridis Maja Pantic SSL 35 28 0 04 May 2020
Multi-task self-supervised learning for Robust Speech Recognition Mirco Ravanelli Jianyuan Zhong Santiago Pascual P. Swietojanski João Monteiro J. Trmal Yoshua Bengio SSL 189 288 0 25 Jan 2020
Unsupervised Representation Disentanglement using Cross Domain Features and Adversarial Learning in Variational Autoencoder based Voice Conversion Wen-Chin Huang Hao Luo Hsin-Te Hwang Chen-Chou Lo Yu-Huai Peng Yu Tsao Hsin-Min Wang DRL 17 42 0 22 Jan 2020
Deep Representation Learning in Speech Processing: Challenges, Recent Advances, and Future Trends S. Latif R. Rana Sara Khalifa Raja Jurdak Junaid Qadir Björn W. Schuller AI4TS 37 81 0 02 Jan 2020
Towards Unsupervised Speech Recognition and Synthesis with Quantized Speech Representation Learning Alexander H. Liu Tao Tu Hung-yi Lee Lin-Shan Lee SSL 37 50 0 28 Oct 2019
Mockingjay: Unsupervised Speech Representation Learning with Deep Bidirectional Transformer Encoders Andy T. Liu Shu-Wen Yang Po-Han Chi Po-Chun Hsu Hung-yi Lee SSL 47 372 0 25 Oct 2019
Generative Pre-Training for Speech with Autoregressive Predictive Coding Yu-An Chung James R. Glass SSL 31 173 0 23 Oct 2019
On Completeness-aware Concept-Based Explanations in Deep Neural Networks Chih-Kuan Yeh Been Kim Sercan O. Arik Chun-Liang Li Tomas Pfister Pradeep Ravikumar FAtt 122 297 0 17 Oct 2019
vq-wav2vec: Self-Supervised Learning of Discrete Speech Representations Alexei Baevski Steffen Schneider Michael Auli SSL 28 661 0 12 Oct 2019
Deep Learning for Deepfakes Creation and Detection: A Survey Thanh Thi Nguyen Quoc Viet Hung Nguyen Dung Nguyen D. Nguyen Thien Huynh-The S. Nahavandi Thanh Tam Nguyen Viet Quoc Pham Cu Nguyen 31 433 0 25 Sep 2019
Combining Adversarial Training and Disentangled Speech Representation for Robust Zero-Resource Subword Modeling Siyuan Feng Tan Lee Zhiyuan Peng 13 21 0 17 Jun 2019
Investigation of F0 conditioning and Fully Convolutional Networks in Variational Autoencoder based Voice Conversion Wen-Chin Huang Yi-Chiao Wu Chen-Chou Lo Patrick Lumban Tobing Tomoki Hayashi Kazuhiro Kobayashi Tomoki Toda Yu Tsao H. Wang DRL 27 13 0 02 May 2019
Incorporating Symbolic Sequential Modeling for Speech Enhancement Chien-Feng Liao Yu Tsao Xugang Lu Hisashi Kawai 27 18 0 30 Apr 2019
Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation Yonghui Wu M. Schuster Zhehuai Chen Quoc V. Le Mohammad Norouzi ... Alex Rudnick Oriol Vinyals G. Corrado Macduff Hughes J. Dean AIMat 718 6,750 0 26 Sep 2016