1. 首页
  2. 大数据
  3. 算法与数据结构
  4. 一种面向大规模微博数据的话题挖掘方法.pdf

一种面向大规模微博数据的话题挖掘方法.pdf

上传者: 2020-08-08 07:40:41上传 PDF文件 562.92KB 热度 15次
随着微博的日趋流行,新浪微博已成为公众获取和传播信息的重要平台之一,针对微博数据的话题挖掘也 成为当前的研究热点。提出一个面向大规模微博数据的话题挖掘方法。首先对大规模微博数据进行分析,基于 Bloom Filter算法对数据进行去重处理,针对微博的特有结构,对文本进行预处理,提出改进的LDA主题模型So- cial Network LDA(SNLDA),采用吉布斯采样法进行模型推导,挖掘出微博话题。实验结果表明,方法能有效地从 大规模微博数据中挖掘出话题信息。
下载地址
用户评论