MBNet: MOS Prediction for Synthesized Speech with Mean-Bias Network

MBNet: MOS Prediction for Synthesized Speech with Mean-Bias Network

27 February 2021

Xu Tan

Xiang-Yang Li

Papers citing "MBNet: MOS Prediction for Synthesized Speech with Mean-Bias Network"

18 / 18 papers shown

Title
APG-MOS: Auditory Perception Guided-MOS Predictor for Synthetic Speech Zhicheng Lian Lizhi Wang Hua Huang 49 0 0 29 Apr 2025
Partial Rank Similarity Minimization Method for Quality MOS Prediction of Unseen Speech Synthesis Systems in Zero-Shot and Semi-supervised setting Hemant Yadav Erica Cooper Junichi Yamagishi Sunayana Sitaram R. Shah 11 0 0 08 Oct 2023
Non-Intrusive Speech Intelligibility Prediction for Hearing Aids using Whisper and Metadata Ryandhimas E. Zezario Fei Chen C. Fuh H. Wang Yu Tsao 37 1 0 18 Sep 2023
RAMP: Retrieval-Augmented MOS Prediction via Confidence-based Dynamic Weighting Haibo Wang Shiwan Zhao Xiguang Zheng Yong Qin 34 12 0 31 Aug 2023
Resource-Efficient Fine-Tuning Strategies for Automatic MOS Prediction in Text-to-Speech for Low-Resource Languages P. Do Matt Coler J. Dijkstra E. Klabbers 32 3 0 30 May 2023
Personalized Audio Quality Preference Prediction Chung-Che Wang Yu-Chun Lin Yu-Teng Hsu J. Jang 22 1 0 16 Feb 2023
SQuId: Measuring Speech Naturalness in Many Languages Thibault Sellam Ankur Bapna Joshua Camp Diana Mackinnon Ankur P. Parikh Jason Riesa 35 17 0 12 Oct 2022
Pre-trained Speech Representations as Feature Extractors for Speech Quality Assessment in Online Conferencing Applications Bastiaan Tamm Helena Balabin Rik Vandenberghe Hugo Van hamme 44 9 0 01 Oct 2022
Comparison of Speech Representations for the MOS Prediction System A. Kunikoshi Jaebok Kim Won-Suk Jun K. Sjölander 16 1 0 28 Jun 2022
NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level Quality Xu Tan Jiawei Chen Haohe Liu Jian Cong Chen Zhang ... Lei He Frank Soong Tao Qin Sheng Zhao Tie-Yan Liu 44 213 0 09 May 2022
MTI-Net: A Multi-Target Speech Intelligibility Prediction Model Ryandhimas E. Zezario Szu-Wei Fu Fei Chen C. Fuh Hsin-Min Wang Yu Tsao 24 13 0 07 Apr 2022
DDOS: A MOS Prediction Framework utilizing Domain Adaptive Pre-training and Distribution of Opinion Scores Wei-Cheng Tseng Wei-Tsung Kao Hung-yi Lee 19 21 0 07 Apr 2022
UTMOS: UTokyo-SaruLab System for VoiceMOS Challenge 2022 Takaaki Saeki Detai Xin Wataru Nakata Tomoki Koriyama Shinnosuke Takamichi Hiroshi Saruwatari 39 180 0 05 Apr 2022
DiffGAN-TTS: High-Fidelity and Efficient Text-to-Speech with Denoising Diffusion GANs Songxiang Liu Dan Su Dong Yu DiffM 75 65 0 28 Jan 2022
HASA-net: A non-intrusive hearing-aid speech assessment network Hsin-Tien Chiang Yi-Chiao Wu Cheng Yu T. Toda Hsin-Min Wang Yih-Chun Hu Yu Tsao 28 12 0 10 Nov 2021
Meta-TTS: Meta-Learning for Few-Shot Speaker Adaptive Text-to-Speech Sung-Feng Huang Chyi-Jiunn Lin Da-Rong Liu Yi-Chen Chen Hung-yi Lee 22 56 0 07 Nov 2021
Deep Learning-based Non-Intrusive Multi-Objective Speech Assessment Model with Cross-Domain Features Ryandhimas E. Zezario Szu-Wei Fu Fei Chen C. Fuh Hsin-Min Wang Yu Tsao DiffM 28 75 0 03 Nov 2021
SVSNet: An End-to-end Speaker Voice Similarity Assessment Model Cheng-Hung Hu Yu-Huai Peng Junichi Yamagishi Yu Tsao Hsin-Min Wang 29 5 0 20 Jul 2021