1. 首页
  2. 网络技术
  3. 网络基础
  4. 一种新的基于概念树的主题网络爬虫方法

一种新的基于概念树的主题网络爬虫方法

上传者: 2020-04-24 15:11:38上传 PDF文件 227.99KB 热度 18次
一种新的基于概念树的主题网络爬行方法。与传统基于关键词描述主题的方法不同,本文提出基于叙词表来 构建一种称为概念树的表示方法来描述主题的概念。在此基础上,本文给出锚文本和HTML页面内容与主题相关度的 计算方法。在分析URL的相关度时,首先判断其锚文本的相关度是否达到一定的阈值
下载地址
用户评论