1. 首页
  2. 编程语言
  3. Perl
  4. 基于行块分布函数的通用网页正文抽取算法

基于行块分布函数的通用网页正文抽取算法

上传者: 2019-05-28 17:37:08上传 RAR文件 1.87MB 热度 33次
运用正则表达式能够精确的抽取某一固定格式的页面,但面对形形色色的HTML,运用规则处置难免捉襟见肘。能不能高效、精确的将一个页面的正文抽取出来,并做到在大范围网页范围内通用,这是一个直接关系上层应用的难题。
下载地址
用户评论
码姐姐匿名网友 2019-05-28 17:37:09

坑爹的,毛都没有

码姐姐匿名网友 2019-05-28 17:37:09

没有源码根本不好用,上面评论都是刷的吧就当5分喂狗了

码姐姐匿名网友 2019-05-28 17:37:09

没有源码,也没有相应的类库,坑爹货

码姐姐匿名网友 2019-05-28 17:37:09

这里面真的是有源码的,算法比较清晰精简,效果也还不错,思路不错。

码姐姐匿名网友 2019-05-28 17:37:09

上边评论的都是骗纸,就给了一个.exe文件,根本不是介绍的那样。一点用都没有。。。

码姐姐匿名网友 2019-05-28 17:37:09

很有用,学习了

码姐姐匿名网友 2019-05-28 17:37:09

做爬虫的时候用上了,相当不错

码姐姐匿名网友 2019-05-28 17:37:09

做新闻爬虫的时候用上了,谢谢

码姐姐匿名网友 2019-05-28 17:37:09

资源不错,值得下载

码姐姐匿名网友 2019-05-28 17:37:09

很好的资源,但是我想看到源码