网页抓取工具metastudio
MetaSeeker是一个Web网页抓取/数据抽取/页面信息提取工具包,能够按照用户的指导,从Web页面上筛选出需要的信息,并输出含有语义结构的提取结果文件(XML文件),众所周知,Web页面显示的信息是给人阅读的,对于机器来说,是无结构的,MetaSeeker解决了一个关键问题:将无结构的Web页面信息转换成有结构的适于机器处理的信息。可以应用于专业搜索、Mashup和Web数据挖掘领域。metastudio是MetaSeeker工具包中的一个,具体参看安装手册。
下载地址
用户评论
版本有点老,不是太好用
需要验证码,没法继续试用。谢谢分享
很好。可以用
能用,谢谢提供资源
还不错,挺有帮助的
版本不对,没有安装上。
好用的工具,不过版本有点老
版本有点老了,建议后来者注意版本
工具是不错,如果能绕过验证码,就完美了