金油条网页正文提取器.Net组件1.0
该组件包括一个开发用的DLL,用.net编写,里面有一个asp.net的DEMO文件(这个是时隔去年DEMO发布后的1年才发布,但是和1年前版本是一样的,新版本暂不予发布)。 大家可以在非商业用途使用。 金油条正文提取器是基于文本距离去噪,精度默认是20,用于网站的新闻,文章等的正文提取,特别结合蜘蛛用处广泛。由于是一个算法demo,所以没有做过大的功能扩展,编码大部分可以自动识别。 最新版本和在线演示。详见: http://www.shoula.net/ParseContent 如果要最新版本,或者对这个感兴趣的。 可以和我联系或者加入 QQ群:50453294. QQ:6782435 金油条
用户评论
exe文件怎么不能运行
不好用啊。。。。。