Audi Ding 源码
车队:奥迪 说话人识别 介绍 说话人识别原则 测试1:聆听数据 在侦听于3/14/2021提供(更新)的数据之后,我们通过侦听提供的文件来建立基本事实数据。 已确定以诊断模式跟踪数据。 培训演讲者1对应于测试演讲者1、2至2、3至3等。 培训讲者 1个 2个 3 4 5 6 7 8 9 10 11 测试演讲者 1个 2个 3 4 5 6 7 8 9 10 11 测试2:查看数据 在这里,我们可以看到扬声器1的语音信号示例图。我们将每个信号的幅度归一化为最大幅度1,以对信号进行归一化。 信号s9-s11包含立体声数据。 在这些情况下,我们仅在读取文件时保留第一个实例。 测试2:STFT的周期图 发现每个信号的采样频率为12.5 kHz。 这意味着256个样本长帧的长度为20.5 ms。 推荐的帧长N为20毫秒至30毫秒。 我们继续使用N = 312,
用户评论