1. 首页
  2. 考试认证
  3. 思科认证
  4. 基于连续语音的说话人识别.zip

基于连续语音的说话人识别.zip

上传者: 2020-10-30 02:12:33上传 ZIP文件 25.25MB 热度 31次
本代码是基于DTW(动态时间规则)算法以及GMM(混合高斯模型)进行的说话人识别的程序。 现在大部分的说话人识别模型是基于MFCC的混合高斯模型设计的,但基于此的识别方式会受说话人之间相互模仿的影响,所以增加了一种特征参数,基音周期。 基因周期包含了语音频率结构信息,,不易模仿。同时若直接对高斯混合模型进行解混会使识别速度很慢,所以先用DTW再用GMM可以极大地缩减识别时间。 注意:此代码仅为说话人识别代码,后续若要进行语音文件录制请自行解决,本程序不提供录音功能,另外程序运行的界面为纯代码编写的菜单界面。 为了使使用更加条理清晰,建议后续添加说话人按照freespeech中已经建成的4个
用户评论