垂直搜索引擎的抓取技术研究 上传者:gooder_sun 2019-04-27 01:47:56上传 NH文件 3.92MB 热度 44次 本文首先介绍了垂直搜索抓取系统的体系结构,提出了一种分布式和基于可展插件的垂直搜索抓取系统框架,其分布式特性和插件模式都便于将来的扩。然后讨论了垂直搜索抓取系统中隐蔽网抓取的三个问题,并针对隐蔽网抓取结果消重的问题提出了一种自学习的中文地址判重方法;接下来针对垂直搜索时效性问题提出了一种基于查询驱动的实时抓取方式;讨论了并比较了影响垂搜索抓取系统的抓取模式、抓取策略和抓取频率,在本文的系统中采用了稳定续模式、及时替换式更新、实时抓取与固定频率相结合的方式。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 码姐姐匿名网友 2019-04-27 01:47:56 对于垂直搜索引擎的一些算法及相关的概念的了解来说,这资料指的一看 发表评论 gooder_sun 资源:3 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com
对于垂直搜索引擎的一些算法及相关的概念的了解来说,这资料指的一看