1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于关联规则的文本聚类算法的研究.pdf

论文研究基于关联规则的文本聚类算法的研究.pdf

上传者: 2019-09-15 01:57:46上传 PDF文件 89.15KB 热度 40次
K均值聚类算法是目前一种较好的文本分类算法,算法中的相似度计算通常基于词频统计,小文档或简单句子由于词频过小,使用该算法聚类效果较差。为此,提出了一种基于词语关联度的相似度计算算法,对简单文档集执行关联规则算法,得出基于关键词的关联规则,并根据这些规则求得词语关联度矩阵,然后由权重对文本进行文本特征向量表示,最后借助于关联度矩阵和文本特征向量,并按一定算法计算出句子相似度。实验证明该算法可得到较好的聚类结果,且其不仅利用词频统计的方法而且考虑了词语间的关系。
用户评论