Lip2Wav:这是包含我们2020年CVPR论文代码的存储库标题为“学习准确的口语到语音合成的个别说话风格” 源码
更新:如果您正在寻找Wav2Lip, Lip2Wav 仅通过唇部动作即可产生高质量的语音。该代码是论文的一部分:在CVPR'20上发表的论文,学习个人说话风格以实现准确的语音合成。 | | 最近更新 发布了适用于所有扬声器的数据集和预训练模型! 已发布在LRW数据集上训练的多扬声器单词级Lip2Wav模型的预训练模型! (分支) 强调 在不受限制的情况下,仅通过嘴唇运动即可产生可理解的语音的第一项工作。 问题的序列到序列建模。 提供5个扬声器的数据集,其中包含100多个小时的视频数据! 提供了完整的培训代码和预训练的模型。 推理代码从预训练的模型生成结果。 还提供了用于计算论文中报告的指标的代码。 你也可能对此有兴趣: :party_popper:使用Wav2Lip进行口语同步的语音视频到任何语音: : 先决条件 Python 3.7.4 (此版本已通过代码测试) ffmpeg: sudo apt
用户评论