1. 首页
  2. 移动开发
  3. 其他
  4. 论文研究 基于链接和内容的BLCT主题爬行算法研究.pdf

论文研究 基于链接和内容的BLCT主题爬行算法研究.pdf

上传者: 2020-07-17 06:37:48上传 PDF文件 619.48KB 热度 18次
为了高效地获取与主题相关的资源,就垂直搜索引擎展开了研究。首先,在现有的PageRank算法基础上,提出一种改进的PageRank算法来测量网页的链接相似度;其次,从单个网页考虑,利用每个网页的url、title和正文,给出基于内容的相似度的计算方法;最后结合内容相似度和链接相似度,提出了一种基于链接和内容的BLCT主题爬行算法。实验结果表明,该算法在平均收获率和目标召回率上有显著提高,爬行的网页主题相关性也提高了。
下载地址
用户评论