1. 首页
  2. 数据库
  3. 其它
  4. 基于语音的说话者识别:使用语音MFCC和GMM识别说话者 源码

基于语音的说话者识别:使用语音MFCC和GMM识别说话者 源码

上传者: 2021-02-06 08:41:56上传 ZIP文件 56.38KB 热度 46次
基于语音的说话人识别 说话人识别/识别使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。 使用三角形重叠窗口,将以上获得的光谱的功率映射到mel刻度上。 记录每个梅尔频率下的功率对数。
用户评论