force alignmet 对普通话语料进行力对齐
这是一个使用HTK工具包自动对齐语料库的工具。我为我的研究工作引入了它,我想分享它以帮助那些不熟悉这个工具的用户。PS:是普通话用的,如果你想用在其他语言上,你需要更改你语言的通用目录中的dict文件。使用该工具的要求包括:HTK、Perl5.8 和 GNU制造。
目录结构如下:
-
wav : 包含wav文件
-
脚本:包含用于对齐的perl脚本
-
general : 包含字典转录和其他一般文件
-
config:包含HTK的配置文件
教程步骤
-
准备
-
编辑
script/align.pl
中的第2行,指定您的HTK PATH。 -
将您的wav文件放在wav目录中。
-
在general目录中创建一个名为words.mlf的文件,该文件应包含您的话语转录,格式如下:
```
#!MLF!#
\" /201.lab\"九时夏于耶曲.
\" /202.lab\"我嘛上呐赖.
```
您可以使用shell、perl或其他脚本生成此文件。
- 运行
如果你对普通话的使用或者测试感兴趣,可以参考一些相关资源,如普通话范文普通话测试说话范文,或是借助普通话培训 来提高你的普通话水平。若你有特殊需求,还可以探索更多的自动对齐工具 选项,这些资源能为你的研究或学习提供更多帮助和支持。
下载地址
用户评论