Learning to Maximize Speech Quality Directly Using MOS Prediction for Neural Text-to-Speech

Learning to Maximize Speech Quality Directly Using MOS Prediction for Neural Text-to-Speech | IEEE Journals & Magazine | IEEE Xplore