基于改进深度置信网络的中文实体检测
实体检测是自然语言处理的一个研究热点,是从无结构的文本中检测出命名实体。深度置信网络(Deep Belief Nets,DBN)的核心组件为受限玻尔兹曼机(Restricted Boltzmann Machine,RBM),RBM的训练传统采用对比散度准则(Contrastive Divergence,CD),但CD是对数似然梯度有偏差的近似。为此,提出基于平均对比散度准则(Average Contrastive Divergence,ACD)训练的DBN的实体检测模型,利用MSRA语料库作训练。采用词袋模型作为输入向量,结合词性特征以及上下文特征。并将其与传统的CD准则作对比。实验
用户评论