Using VAEs and Normalizing Flows for One-shot Text-To-Speech Synthesis
of Expressive Speech

Using VAEs and Normalizing Flows for One-shot Text-To-Speech Synthesis of Expressive Speech

28 November 2019

Vatsal Aggarwal

Jaime Lorenzo-Trueba

Roberto Barra-Chicote

Papers citing "Using VAEs and Normalizing Flows for One-shot Text-To-Speech Synthesis of Expressive Speech"

13 / 13 papers shown

Title
In Other News: A Bi-style Text-to-speech Model for Synthesizing Newscaster Voice with Limited Data N. Prateek Mateusz Lajszczak Roberto Barra-Chicote Thomas Drugman Jaime Lorenzo-Trueba Thomas Merritt S. Ronanki Trevor Wood 39 30 0 04 Apr 2019
Effect of data reduction on sequence-to-sequence neural TTS Javier Latorre Jakub Lachowicz Jaime Lorenzo-Trueba Thomas Merritt Thomas Drugman S. Ronanki Klimkov Viacheslav 63 59 0 15 Nov 2018
Towards achieving robust universal neural vocoding Jaime Lorenzo-Trueba Thomas Drugman Javier Latorre Thomas Merritt Bartosz Putrycz Roberto Barra-Chicote Alexis Moinet Vatsal Aggarwal DRL 85 19 0 15 Nov 2018
Nonparallel Emotional Speech Conversion Jian Gao Deep Chakraborty H. Tembine Olaitan Olaleye 46 69 0 03 Nov 2018
Hierarchical Generative Modeling for Controllable Speech Synthesis Wei-Ning Hsu Yu Zhang Ron J. Weiss Heiga Zen Yonghui Wu ... Ye Jia Zhiwen Chen Jonathan Shen Patrick Nguyen Ruoming Pang BDL 66 275 0 16 Oct 2018
Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis Ye Jia Yu Zhang Ron J. Weiss Quan Wang Jonathan Shen ... Zhiwen Chen Patrick Nguyen Ruoming Pang Ignacio López Moreno Yonghui Wu 251 830 0 12 Jun 2018
Expressive Speech Synthesis via Modeling Expressions with Variational Autoencoder K. Akuzawa Yusuke Iwasawa Y. Matsuo 35 139 0 06 Apr 2018
Towards End-to-End Prosody Transfer for Expressive Speech Synthesis with Tacotron RJ Skerry-Ryan Eric Battenberg Y. Xiao Yuxuan Wang Daisy Stanton Joel Shor Ron J. Weiss R. Clark Rif A. Saurous 54 554 0 24 Mar 2018
Fitting New Speakers Based on a Short Untranscribed Sample Eliya Nachmani Adam Polyak Yaniv Taigman Lior Wolf 43 84 0 20 Feb 2018
Natural TTS Synthesis by Conditioning WaveNet on Mel Spectrogram Predictions Jonathan Shen Ruoming Pang Ron J. Weiss M. Schuster Navdeep Jaitly ... Yuxuan Wang RJ Skerry-Ryan Rif A. Saurous Yannis Agiomyrgiannakis Yonghui Wu 77 2,694 0 16 Dec 2017
Improving Variational Auto-Encoders using Householder Flow Jakub M. Tomczak Max Welling BDL DRL 68 175 0 29 Nov 2016
WaveNet: A Generative Model for Raw Audio Aaron van den Oord Sander Dieleman Heiga Zen Karen Simonyan Oriol Vinyals Alex Graves Nal Kalchbrenner A. Senior Koray Kavukcuoglu DiffM 375 7,389 0 12 Sep 2016
Auto-Encoding Variational Bayes Diederik P. Kingma Max Welling BDL 433 16,944 0 20 Dec 2013