利用卷积神经网络进行稳健的事件识别
基于信息量的传统声音事件识别方法前端功能,例如MFCC,带有后端HMM等测序方法往往在干扰声的存在。 由于噪声破坏在实际情况中可能是不可避免的,这一点很重要开发更强大的功能和分类器。 近期进展在这个领域使用强大的机器学习技术具有高维输入特征(例如声谱图) 或听觉图像。 这些提高了鲁棒性,这在很大程度上要归功于后端分类器的判别能力。 我们通过提出派生的新颖特征进一步扩展了这一点来自频谱图能量触发,并与强大的卷积神经网络的分类能力(CNN)。 所提出的方法表现出优异的性能在比较噪音的情况下反对最新的标准评估方法任务。 据作者所知,在第一个应用程序中CNN在此领域的排名。
下载地址
用户评论