1. 首页
  2. 人工智能
  3. 深度学习
  4. FastSpeech2:基于Transformer的端到端文本到语音合成模型

FastSpeech2:基于Transformer的端到端文本到语音合成模型

上传者: 2023-03-17 13:07:44上传 ZIP文件 136.13MB 热度 11次

FastSpeech2是一种基于Transformer的端到端文本到语音合成模型,可以轻松地将给定的文本转换成语音。该模型拥有高效的训练和生成速度,同时能够生成高质量的语音。FastSpeech2采用了FastSpeech的框架,但加入了对峰值信号估计的支持,使得生成的语音更加自然流畅。此外,FastSpeech2还引入了一个额外的噪声抑制器,以便最大程度地减少噪音对语音合成的影响,从而提高语音合成的质量。

下载地址
用户评论