1. 首页
  2. 移动开发
  3. 其他
  4. 中心聚类和语义特征融合的网页信息文本挖掘方法

中心聚类和语义特征融合的网页信息文本挖掘方法

上传者: 2020-08-18 10:11:02上传 PDF文件 574.65KB 热度 14次
针对网页信息内容丰富且结构复杂,难以准确挖掘的问题,采用中心聚类和语义特征相互融合的方法.利用中心聚类算法确定样本最终的聚类中心,根据每个词在网页中出现的频率和词的上下文语义,构造一个网页-词语的权重映射矩阵,并将语义特征作为中心聚类相似性的判断依据,完成网页文本信息的挖掘.实验结果表明:利用该方法对网页文本进行挖掘,在时间增加不多的情况下,可以获得更高的召回率和准确率.
用户评论