1. 首页
  2. 数据库
  3. 其它
  4. 【算法】TF IDF算法及应用

【算法】TF IDF算法及应用

上传者: 2021-02-01 01:14:24上传 PDF文件 646.67KB 热度 13次
有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphraseextraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10分钟就可以理解,这就是我今天想要介绍的TF-IDF算法。让我们从一个实例开始讲起。假定现在有一篇长文《中国的蜜蜂养殖》,我们准备用计算机提取它的关键词。一个容易想到的思路,就是找到出现次数最多的词。如果某个词很重
用户评论