1. 首页
  2. 数据库
  3. 其它
  4. Speaker Recognition System:EEC201最终项目 源码

Speaker Recognition System:EEC201最终项目 源码

上传者: 2021-04-19 21:14:12上传 ZIP文件 278.05KB 热度 10次
说话人识别系统 EEC201最终项目 团队成员:钱伟泰,Ata Vafi 抽象的 该项目建立了一个依靠少量样本的说话人识别系统。它主要具有3个阶段的流水线:(1)特征提取(2)特征学习(3)说话人识别。在特征提取阶段,使用海明窗尺寸为256的短时傅立叶变换(STFT)。然后将20个滤波器用于MFCC以生成20维训练向量。在特征提取之后,使用矢量量化和k均值聚类来学习这些特征。在使用陷波滤波器生成更多噪声数据集之前,该系统在训练集上达到100%的精度,在测试集上达到100%的精度。 介绍 方法 首先,由于音频幅度不包含用户的任何唯一信息,因此将幅度标准化为[-1,1]范围。接下来,对信号的主要部分进行削波,并对削波后的信号执行短时离散傅立叶变换。在stft中,语音信号被阻塞为N个样本的重叠帧:第一个帧由前N个样本组成。第二帧在第一帧之后开始M个采样,并与N-M个采样重叠,以此类推。N和M为N
用户评论