PGEssays 用于下载Paul Graham博客文章的Java网络爬虫
作为文章的常客,我想把它们全部收集起来,以便我可以离线阅读。这是一个项目,从他的网站上抓取Paul Graham的所有文章。 截至撰写时(2014年3月3日),共收集了155个帖子。
使用的外部库:JSoup - 在这个项目中广泛使用的HTML解析器。
MIT许可证
版权所有(c) 2014特此授予任何人免费获得本软件和相关文档文件(“软件”)副本的许可,不受限制地处理本软件,包括但不限于使用、复制、修改、合并的权利、发布、分发、再许可和/或销售本软件的副本,并允许向其提供本软件的人员这样做,但须符合以下条件:
上述版权声明和本许可声明应包含在软件的所有副本或重要部分中。
本软件按“原样”提供,不提供任何形式的明示或暗示的保证,包括但不限于适销性、特定用途的适用性和不侵权的保证。在任何情况下,作者或版权持有人不对任何索赔、损害或其他责任负责。
用户评论