GMM-UBM说话人确认样本列表
说话人确认实验用的lists.rar
挺实用,尤其是你在搞基于GMM-UBM的识别时,数据组织一下就顺手了。里面估计是样本列表,像每段语音的文件名
、说话人 ID
啥的,全帮你列好了。
高斯混合模型(GMM)这块其实没那么玄乎,说白了就是把语音看成是好几种声音特征的组合。UBM 就是做个“大锅饭”,先用多人的语音做个通用背景模型,你训练你自己的专属模型再去比对。流程上挺清晰,注册——建模,验证——对比。
文件用得最多的地方,一般就是训练和测试时批量跑任务,比如你要用MFCC
提特征,扔进 GMM 模型里,能不能过验证就看对数似然比
(LLR)那步了。得细致点,像加个Feature warping
或者RASTA
滤波,效果还能再上一档。
如果你后面还打算搞更复杂点的,比如i-vector或者JFA
,建议你先把 GMM-UBM 这一套跑顺了,思路就通了。顺带放几个还不错的资源,都是一线搞说话人识别的:Alize i-vector 提取、GMM_UBM 概述、RASTA 滤波那篇。
如果你刚开始接触说话人识别,这个lists.rar
文件配合一套干净的语音样本就能动起来了,别忘了加点预,尤其是降噪和静音段剔除,不然 GMM 训练出来效果挺飘的。
下载地址
用户评论