1. 首页
  2. 编程语言
  3. 其他
  4. 论文研究基于LSA和结构特性的微博话题检测.pdf

论文研究基于LSA和结构特性的微博话题检测.pdf

上传者: 2019-07-29 11:31:09上传 PDF文件 974.92KB 热度 23次
针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在语义分析(LSA)的微博文本模型以解决数据稀疏性问题,最后结合时间信息给出新的相似度计算方法,并采用凝聚层次聚类法检测微博话题。实验结果表明,提出的方法降低了话题检测的错失率,大大提高了微博话题检测的性能。
下载地址
用户评论