FastSpeech2:基于Transformer的端到端文本到语音合成模型
FastSpeech2是一种基于Transformer的端到端文本到语音合成模型,可以轻松地将给定的文本转换成语音。该模型拥有高效的训练和生成速度,同时能够生成高质量的语音。FastSpeech2采用了FastSpeech的框架,但加入了对峰值信号估计的支持,使得生成的语音更加自然流畅。此外,FastSpeech2还引入了一个额外的噪声抑制器,以便最大程度地减少噪音对语音合成的影响,从而提高语音合成的质量。
下载地址
用户评论