1. 首页
  2. 课程学习
  3. 嵌入式
  4. ICTCLAS2009版中文分词系统

ICTCLAS2009版中文分词系统

上传者: 2018-12-29 00:11:59上传 RAR文件 9.68MB 热度 29次
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009 用户词典接口扩展 用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。 分词粒度可调 可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。 词性标注功能加强 多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大一级标注集,北大二级标注集。 关键词提取 自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。 指纹提取 根据文章的内容,结构,词语间的关系,分析出能够表示该文章的语义指纹,使用数字序列表示。
下载地址
用户评论
码姐姐匿名网友 2018-12-29 00:12:00

还行,不如去官网下载。

码姐姐匿名网友 2018-12-29 00:12:00

还是有点用的。

码姐姐匿名网友 2018-12-29 00:12:00

这个分词工具很好用

码姐姐匿名网友 2018-12-29 00:12:00

安装后提示,初始化失败

码姐姐匿名网友 2018-12-29 00:12:00

是个好东西!非常感谢。。

码姐姐匿名网友 2018-12-29 00:12:00

ictcls init failed,初始化失败,该怎么设置呢?

码姐姐匿名网友 2018-12-29 00:12:00

唉,下载安装后,打开不了,显示“ictcls init failed",怎么办?急死了。

码姐姐匿名网友 2018-12-29 00:12:00

好用,用这个工具做分词,对信息可视化太实用了。

码姐姐匿名网友 2018-12-29 00:12:00

是好东西,可惜是windows版的,想要个linux 的阿