中科院关键词抽取程序
关键词抽取(Keywords Extraction)指的是如何从一篇文档(或多篇相关文档)中自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。 I3S KeyExtrator采用适合于汉语特点的关键词抽取技术。该系统基于中科院计算所多年积累的背景知识库,将汉语智能分词算法与基于AV邻接的新词/短语识别方法有机结合,并利用信息论方法对抽取出的词和短语进行重要性评估,同时借助模糊匹配技术对中间抽取结果进行冗余过滤,使抽取出的关键词具有很好的主题代表性和区分度。
用户评论
不是我想要的,我想要基于java的代码实现
不怎么好用
说是过期了啊,郁闷
本以为是源码了,价值大大降低
太过专业,没有编程基础的人比较难看懂
要是有源码就更好了
谢谢分享 怎么没有源码
不靠谱啊,还是复旦的好啊,是不是
下载了几次都失败了。
感觉一般,做比较用吧