1. 首页
  2. 编程语言
  3. Web开发
  4. 横瓜中文分词器

横瓜中文分词器

上传者: 2019-09-23 22:30:57上传 RAR文件 645.47KB 热度 23次
横瓜中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。
下载地址
用户评论