通过LPN进行语音检测 源码
通过地标池网络进行语音活动检测 此仓库包含我们FG 19论文的数据集和代码,。 原始文件是在Tensorflow中实现的。 这是Pytorch版本。 LSW数据集 可在下载LSW数据集:其中包括对齐的嘴部图像和对齐的嘴部地标。 用法 该代码是用Python 3.6编写的。 pytorch版本是1.2。 该代码包含用于LSW数据集上语音活动分类的不同模型: 外观CNN 地标池网络(LPN) LPN +外观CNN。 要运行培训代码: python main.py --model_type lpn 供测试用: python main.py --model_type lpn --is_t
用户评论