1. 首页
  2. 数据库
  3. DB2
  4. 基于K means的私人微博聚类算法改进

基于K means的私人微博聚类算法改进

上传者: 2020-11-29 10:41:19上传 PDF文件 306.31KB 热度 21次
针对私人微博内容进行聚类研究,结合私人微博的内容和结构特点提出了基于K-means的改进聚类算法。通过添加引用和评论内容丰富了文本内容,降低了短文本矩阵向量严重稀疏性带来的聚类算法准确性降低的影响;通过甄别“微话题”内容和改进相似度的计算,找到初始化类别并进行初步计算得到合适的类别数目和初始中心点,解决了K-means算法中聚类数目K需人工指定和初始中心点选取随机性的问题。实验结果表明,改进后的算法不仅可以自适应地得到K值,较普通的K-means算法在聚类的准确率上有所提高。
下载地址
用户评论