1. 首页
  2. 数据库
  3. 其它
  4. 基于频谱图和局部二值模式的说话人识别

基于频谱图和局部二值模式的说话人识别

上传者: 2021-05-04 17:28:35上传 PDF文件 1.62MB 热度 20次
本文提出了一种基于声谱图的文本独立,闭集说话人识别方法动态时间规整(DTW)算法。 预处理后的语音信号被分为一些块,然后进行计算以获得频谱的幅度,从而创建频谱图。 本地二进制模式(LBP)运算符用于获取被视为LBP向量的LBP向量。 语音功能。 每个LBP向量之间的距离通过DTW算法测量, 其目的是通过反复扭曲时间轴直到输入一个LBP向量,以对齐两个输入LBP向量序列。 找到两个LBP向量之间的最佳匹配。 通过这种灵活而强大的顺序数据匹配时,所提出的方法可以确定一组封闭的说话者中的哪一位是目标说话者。 进行了数值实验以验证理论结果并清楚地表明识别方法具有可接受的准确性。
下载地址
用户评论