Haw数据清洗和抓取工具
HAWK是一种数据采集和清洗工具,依据GPL协议开源,能够灵活,有效地采集来自网页,数据库,文件,并通过可视化地拖拽,快速地进行生成,过滤,转换等操作。其功能最适合的领域,是爬虫和数据清洗。Hawk的含义为“鹰”,能够高效,准确地捕杀猎物。HAWK使用C#编写,其前端界面使用WPF开发,支持插件扩展。通过图形化操作,能够快速建立解决方案。GitHub地址:https://github.com/ferventdesert/Hawk其Python等价的实现是etlpy:http://www.cnblogs.com/buptzym/p/5320552.html笔者专门为其开发的工程文件已公开在GitHub:https://githu
用户评论
这个不错,很好
好用,忘了评价了
非常棒的爬虫工具,使用配置容易上手
非常好用的工具
楼主是一个很厉害的人,貌似在某绿色房产网站工作。
使用了下,挺好用的一个工具。确实能抓取,不过有时候会闪退
很不错的工具!
下载正常,可以看下学习下
good!good!good!good! 可以研究。
好东西,研究研究