风越批量文本提取、网页采集器
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。支持从其它网站直接提取文本内容,生成所需数据库文件支持GB2312/UTF-8多种编码可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。可设置提取文件的间隔,避免下载网页过快,服务器不响应提供多种查找、获取信息的方式:提取文件中全部email邮件地址提取文件中全部互联网址(无参数)提取文件中全部互联网址(带参数)提取HTML文件中body的文本内容提取HTML文件中title与body的文本内容提取HTML文件中textarea的文本内容提取HTML网页的显示文本内容提取DOC/RTF等文件中全部文本内容并可自定义正则表达式获取信息
用户评论
功能可以实现,但不是自己想要的类型。
很好,就是不太会用
不错 就是应该写个教程详细点的
可以使用。不错