论文研究基于深度自编码网络语音识别噪声鲁棒性研究.pdf
为了解决传统径向基(Radialbasisfunction,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(MelFrequencyCepstrumCoefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(GammatoneFrequencyCepstrumCoefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MF
用户评论