1. 首页
  2. 网络技术
  3. 网络基础
  4. Java网络爬虫及正文提取

Java网络爬虫及正文提取

上传者: 2019-09-13 15:20:40上传 RAR文件 534.94KB 热度 41次
用Java语言实现的网络爬虫,并使用正则表达式提取html网页的正文!
下载地址
用户评论
码姐姐匿名网友 2019-09-13 15:20:40

没有什么用啊啊

码姐姐匿名网友 2019-09-13 15:20:40

没太看懂,我太菜了么

码姐姐匿名网友 2019-09-13 15:20:40

不错,可以用

码姐姐匿名网友 2019-09-13 15:20:40

基本功能能实现,可以下载网页上链接的htm,但是对正文的处理显得不足,正则表达式的使用还应更具体一点,总之差强人意

码姐姐匿名网友 2019-09-13 15:20:40

没有找到正文提取的方法

码姐姐匿名网友 2019-09-13 15:20:40

不是我想要的,参考下自己写

码姐姐匿名网友 2019-09-13 15:20:40

能够提取网页中的正文 很好

码姐姐匿名网友 2019-09-13 15:20:40

还可以吧 只是参考

码姐姐匿名网友 2019-09-13 15:20:40

还是不是我想要的,不能智能判断正文,可能要求太高了?!

码姐姐匿名网友 2019-09-13 15:20:40

部分调试的代码没删,花了点时间才全部弄懂,可以扩展起来,还不错吧。