pika:基于Pytorch和(Py)Kaldi的轻量级语音处理工具包 源码
PIKA:基于Pytorch和(Py)Kaldi的轻量级语音处理工具包 PIKA是基于Pytorch和(Py)Kaldi的轻量级语音处理工具包。 第一个版本侧重于端到端语音识别。 我们使用作为深度学习引擎,使用进行数据格式化和特征提取。 主要特点 即时数据扩充和特征提取加载程序 TDNN变压器编码器以及基于卷积和变压器的解码器模型结构 RNNT训练和批量解码 带有外部Ngram FST的RNNT解码(即时记录,aka浅层融合) RNNT最低贝叶斯风险(MBR)培训 用于RNNT的LAS前向和后向记录器 基于高效BMUF(块模型更新过滤)的分布式训练 安装和依赖项 通常,我们建议使用因为它具有大多数依赖性。 其他主要依赖性包括 火炬 请访问进行pytorch安装,代码和脚本应能够在pytorch 0.4.0及更高版本上运行。 但是我们建议使用上述1.0.0版本,以便与RNNT丢失模块兼容(
用户评论