1. 首页
  2. 数据库
  3. 其它
  4. EEC201_Project 源码

EEC201_Project 源码

上传者: 2021-04-21 03:02:46上传 ZIP文件 4.2MB 热度 8次
EEC201_Project 团体双声:Begum Kasap,Rishad Raiyan 抽象的 该项目旨在利用梅尔频率倒谱,矢量量化和LGB算法来识别说话者。音频文件经过预处理,以便对其幅度进行归一化并删除所有无声部分。大小为256的汉明窗框用于计算STFT。帧增量设置为256/3。 20个mel滤波器组用于获得20个MFCC系数。使用20个MFCC和16个群集从训练数据集中生成一个密码本。将测试数据集与密码本进行比较,并根据测试数据样本和密码本质心之间的平均失真对说话者进行分类。总共提供了11个音频文件用于培训和测试。如果我们将所有11个音频文件都用于训练和测试,则从提供的训练数据集获得100%的准确性,从提供的测试数据集获得81.82%的准确性。如果我们仅使用8个音频文件进行训练而使用11个音频文件进行测试,则我们的算法可以正确拒绝2/3个新的未知skeaper,并达到71.73%
用户评论