Java网络爬虫及正文提取 上传者:以简驭繁 2019-09-13 15:20:40上传 RAR文件 534.94KB 热度 62次 用Java语言实现的网络爬虫,并使用正则表达式提取html网页的正文! 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 码姐姐匿名网友 2019-09-13 15:20:40 没有什么用啊啊 码姐姐匿名网友 2019-09-13 15:20:40 没太看懂,我太菜了么 码姐姐匿名网友 2019-09-13 15:20:40 不错,可以用 码姐姐匿名网友 2019-09-13 15:20:40 基本功能能实现,可以下载网页上链接的htm,但是对正文的处理显得不足,正则表达式的使用还应更具体一点,总之差强人意 码姐姐匿名网友 2019-09-13 15:20:40 没有找到正文提取的方法 码姐姐匿名网友 2019-09-13 15:20:40 不是我想要的,参考下自己写 码姐姐匿名网友 2019-09-13 15:20:40 能够提取网页中的正文 很好 码姐姐匿名网友 2019-09-13 15:20:40 还可以吧 只是参考 码姐姐匿名网友 2019-09-13 15:20:40 还是不是我想要的,不能智能判断正文,可能要求太高了?! 码姐姐匿名网友 2019-09-13 15:20:40 部分调试的代码没删,花了点时间才全部弄懂,可以扩展起来,还不错吧。 发表评论
没有什么用啊啊
没太看懂,我太菜了么
不错,可以用
基本功能能实现,可以下载网页上链接的htm,但是对正文的处理显得不足,正则表达式的使用还应更具体一点,总之差强人意
没有找到正文提取的方法
不是我想要的,参考下自己写
能够提取网页中的正文 很好
还可以吧 只是参考
还是不是我想要的,不能智能判断正文,可能要求太高了?!
部分调试的代码没删,花了点时间才全部弄懂,可以扩展起来,还不错吧。